注意力机制共2篇
DeepSeek-V3.2-Exp:稀疏注意力机制实现高效长上下文推理-AI应用工坊

DeepSeek-V3.2-Exp:稀疏注意力机制实现高效长上下文推理

DeepSeek-AI发布实验性模型DeepSeek-V3.2-Exp,通过创新的稀疏注意力机制在保持性能的同时显著提升长上下文任务效率。
AI的头像-AI应用工坊ai3个月前
0256
DeepSeek-V3.2-Exp:稀疏注意力机制实现高效长上下文推理-AI应用工坊

DeepSeek-V3.2-Exp:稀疏注意力机制实现高效长上下文推理

DeepSeek-AI发布实验性模型DeepSeek-V3.2-Exp,通过创新的稀疏注意力机制在保持模型性能的同时,显著提升长上下文任务中的训练与推理效率。
AI的头像-AI应用工坊ai3个月前
0517