快科技4月24日消息,官方于今日正式发布了DeepSeek-V4模型。
根据DeepSeek微信公众号发布的信息,DeepSeek-V4支持百万字级别的超长上下文,在智能体能力、世界知识和推理性能方面均处于国内及开源领域的领先水平。
API服务已同步上线,用户只需将model_name参数修改为deepseek-v4-pro或deepseek-v4-flash即可调用。
V4版本延续了DeepSeek一贯的效率优先理念。尽管模型总参数量达到1万亿,但每个token仅需激活约370亿参数,这意味着其推理成本与前代V3基本持平。这种高性价比的设计思路始终是DeepSeek的核心优势。

据了解,DeepSeek V4将部署在华为最新的昇腾芯片上。
为实现这一技术跨越,工程师投入了大量精力解决芯片适配问题。团队不仅重写了核心代码,还完成了从英伟达CUDA生态向华为CANN架构的底层迁移工作。
这一决策不仅涉及重大技术调整,更释放出强烈的战略信号。DeepSeek此次并未为英伟达或AMD提供提前优化适配的机会,而是将早期访问权限率先开放给了国产芯片厂商。
(举报)
