首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

2025-03-25 22:56 · 稿源: 快科技

快科技3月25日消息,今晚,DeepSeek官宣,DeepSeek V3模型已完成小版本升级。

目前版本号为DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验,API 接口和使用方式保持不变。

虽然是小版本更新,但从反馈来看,这次升级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。

据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

同时,在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

在中文写作任务方面,新版V3模型基于R1的写作水平进行进一步优化,同时特别提升了中长篇文本创作的内容质量。

此外,新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

其他方面,该模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

据DeepSeek介绍,DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。

私有化部署时只需更新checkpoint和tokenizer_config.json(tool calls 相关变动)。

模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。

与DeepSeek-R1保持一致,此次DeepSeek开源仓库(包括模型权重)统一采用MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5

举报

  • 相关推荐
  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • WEEX反诈指南:提升警觉,防范高收益陷阱

    近年来数字资产市场快速发展,但网络诈骗层出不穷,包括仿冒交易平台、高收益投资骗局和假客服等手段。WEEX以安全为本,通过多重加密、冷热钱包分离、多因素身份验证等技术防护,结合反诈教育和实时监控系统保护用户。文章提醒投资者警惕高收益承诺,不点击陌生链接,不泄露验证信息,仅通过官方渠道下载APP,强调安全需平台与用户共同维护。

  • 苹果M5芯片正式发布:CPU提升15%、图形性能提升30%!

    苹果正式发布了其全新的M5处理器,这款芯片基于台积电的N3P制程工艺,配备了10核CPU和10核GPU。 从CPU来看,M5采用了与M4相同的10核配置,不同的是采用了6个性能核心和4个效率核心,虽然核心数量没有变化,但苹果表示M5的CPU的多线程性能相比M4提高了15%。 在GPU方面,M5配备了10核GPU

  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • 技嘉发布X3D系列主板:专为AMD X3D处理器打造,游戏性能提升高达25%

    技嘉推出专为AMD Ryzen X3D处理器优化的X870E AORUS X3D系列主板,首发型号包括MASTER与PRO两款。该系列搭载X3D鸡血模式2.0技术,通过AI智能场景识别可自动优化处理器性能,游戏性能最高提升25%。主板采用全快易拆设计,配备免螺丝M.2插槽、磁吸散热装甲及一键拆卸显卡插槽。集成AI黑科技2.0支持DDR5内存超频至9000MT/s+,预装网卡驱动实现开机即联网。两款主板均提供4年质保(含1年免费换新),现已在各大电商平台上市。

  • 京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验

    京东在11.11大促期间升级直播技术,推出“立体3D技术”和“JoyAI大模型”等创新,打破传统直播边界。立体3D技术实现裸眼360度商品展示,用户无需额外设备即可旋转查看产品细节;虚拟偶像Aura等跨次元互动增强趣味性。AI全链路工具简化主播运营,提升内容创作效率。这些举措为用户带来沉浸式购物体验,引领直播电商技术革新方向。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 火山 AI 搜索引擎升级:大模型时代重塑用户体验与业务增长

    火山引擎近日升级企业级AI搜索助手,底层模型升级至豆包大模型1.6,全面提升搜索、推荐、问答能力。该平台支持“开箱即用”,企业可快速构建专属对话式搜索助手,已在电商导购、视频新闻、AI搜图、智能硬件等多场景落地,帮助优化产品体验,为业务增长注入新动能。

今日大家都在搜的词: