站长之家(ChinaZ.com)9月30日 消息:今日,DeepSeek正式对外发布其DeepSeek-V3.2-Exp实验性模型。该模型作为迈向新一代架构的重要中间步骤,在技术层面实现了新突破。
DeepSeek-V3.2-Exp基于V3.1-Terminus进行升级,引入了DeepSeek Sparse Attention(DSA)这一创新的稀疏注意力机制。这一机制首次实现了细粒度稀疏注意力,能够在几乎不影响模型输出效果的前提下,显著提升长文本的训练和推理效率。
为严谨评估稀疏注意力带来的影响,DeepSeek特意将DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus严格对齐。在各领域公开评测集上的测试结果显示,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。
在应用层面,DeepSeek官方App、网页端以及小程序均已同步更新至DeepSeek-V3.2-Exp版本,为用户提供更加高效的服务。与此同时,DeepSeek还宣布对其API价格进行大幅度调整,新价格即刻生效。
具体而言,输入缓存命中价格为0.2元,输入未缓存命中价格为2元,输出价格为3元。DeepSeek表示,新的价格政策将使开发者调用DeepSeek API的成本降低50%以上,这无疑为开发者带来了重大利好。
此外,DeepSeek-V3.2-Exp模型现已在Huggingface与魔搭两大开源平台上线。
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
(举报)