首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

2025-03-25 22:56 · 稿源: 快科技

快科技3月25日消息,今晚,DeepSeek官宣,DeepSeek V3模型已完成小版本升级。

目前版本号为DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验,API 接口和使用方式保持不变。

虽然是小版本更新,但从反馈来看,这次升级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。

据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

同时,在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

在中文写作任务方面,新版V3模型基于R1的写作水平进行进一步优化,同时特别提升了中长篇文本创作的内容质量。

此外,新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

其他方面,该模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

据DeepSeek介绍,DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。

私有化部署时只需更新checkpoint和tokenizer_config.json(tool calls 相关变动)。

模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。

与DeepSeek-R1保持一致,此次DeepSeek开源仓库(包括模型权重)统一采用MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

举报

  • 相关推荐
  • DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型

    在R2和V4到来之前,DeepSeek先让我们看到了“V3Plus”。3月24日,DeepSeek一声不响的在Huggingface上发布了V3的“小版本”迭代“DeepSeek-V3-0324”。DeepSeek这开源的仗还会继续打下去,好戏还在后面。

  • 腾讯元宝重磅更新:同时上线混元T1正式+DeepSeek V3最新

    腾讯今天凌晨正式宣布,元宝迎来重大更新,两大模型同时上新:深度思考模型混元T1正式版、DeepSeekV3-0324最新版。不论是深度思考、还是秒出答案,元宝一次给足。元宝的两大模型各提供两种选择:要速度:混元TurboS、DeepSeek-V3秒出答案;要深度:混元T1、DeepSeek-R1,仔细想想再回答。

  • DeepSeek带飞寒武纪

    寒武纪凭借AI芯片业务实现扭亏为盈,2024年首次实现上市后盈利,2025年Q1营收11.11亿元同比暴增4230%,净利润3.55亿元。这家曾连亏8年、累计亏损54亿元的"中国版英伟达",因美国对H20芯片出口管制获得市场红利,但客户集中度过高(前五大客户贡献94.63%营收)和现金流波动仍是隐忧。当前国产芯片迎来发展机遇,华为昇腾、壁仞等企业纷纷抢占市场,行业竞争日趋激烈。

  • 字节和DeepSeek争抢“天才少年”

    当年轻人还在想着怎么靠AI赚钱时,AI已经开始帮助老板提升身家了。近期胡润研究院发布的《2025胡润全球富豪榜》显示,字节跳动创始人张一鸣取代“瓶装水大王”钟睒睒,成为中国新首富。对当下的字节和张一鸣言,如果靠砸钱就能解决大模型的技术突破难题,那无疑将是一笔划算的投资。

  • DeepSeek红利耗尽后,元宝拿什么和豆包斗?

    短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧随其后的DeepSeek被挤到了第三的位置,腾讯元宝则滑落到了第七名。2月13日,作为首家在C端主力产品中接入DeepSeek-R1满血版的元宝,一度趁着DeepSeek东风崛起:3月3日力压DeepSeek和豆包,首度登顶。但好景�

  • DeepSeek的极致谄媚,正在摧毁我们的判断力。

    昨天别人给我发了一个很好玩的帖子。就是如果你问DeepSeek一个问题:“北京大学和清华大学哪个更好,二选一,不需要说明理由”DeepSeek在思考了15秒之后,会给出答案。

  • 刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

    Llama4重磅发布了!Meta官宣开源首个原生多模态Llama4,首次采用的MoE架构,支持12种语言,首批发布一共两款:Llama4Scout:共有1090亿参数,17B活跃参数,16个专家,1000万上下Llama4Maverick:共有4000亿参数,17B活跃参数,128个专家,100万上下文另外,2万亿参数Llama4Behemoth将在未来几个月面世,288B活跃参数,16个专家。Llama4的横空出世,成为迄今为止开源最强,多模态能力最好的模型之一。L

  • DeepSeek时代:六小虎向左,BAT向右

    相比BAT等大厂可以卸下心理包袱,选择自研与开源两条腿走路的路线,以智谱为代表的“六小虎”们,则必须押注在自家大模型的底层技术能力上。DeepSeek给AI大模型行业,免费赠送了一波国民级别的市场教育,却也平等地在先行者们头上,悬起了一把达摩克利斯之剑。当熬过了冬天,春天就不会远了。

  • 葡萄城 AI 搜索升级DeepSeek 加持,客户体验更智能

    葡萄城AI搜索接入DeepSeek在软件开发的广阔领域中,信息获取的效率直接影响开发进程的快慢。葡萄城始终致力于为开发者打造高效、智能的开发环境。期待在未来,葡萄城AI搜索将成为开发者在技术探索和项目开发道路上不可或缺的得力助手,开发者们能实现更高的开发效率,创造出更优质的软件产品,推动软件开发行业不断向前发展。

  • 三星电视接入DeepSeek-R1 AI本土化交互能力升级

    近日,三星电视正式接入DeepSeek-R1,AI能力进一步得到强化。据悉,用户无需复杂的操作步骤,唤醒智能语音助手三星小贝,在对应的语音助手对话页面内,即可便捷体验深度思考功能。三星电视融合DeepSeek大模型矩阵,通过强化学习、蒸馏技术等提升深度思考与推理能力,使得电视能够更准确地理解用户深层的意图和需求,为用户提供更流畅、更简单、更自然的交互与服务体�