DeepSeek V3小版本大升级：推理、前端开发加强这些能力超越GPT-4.5

2025-03-25 22:56 · 稿源：快科技

快科技3月25日消息，今晚，DeepSeek官宣，DeepSeek V3模型已完成小版本升级。

目前版本号为DeepSeek-V3-0324，用户登录官方网页、App、小程序进入对话界面后，关闭深度思考即可体验，API 接口和使用方式保持不变。

虽然是小版本更新，但从反馈来看，这次升级带来的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。

据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。

DeepSeek V3小版本大升级：推理、前端开发加强这些能力超越GPT-4.5

同时，在HTML等代码前端任务上，新版V3模型生成的代码可用性更高，视觉效果也更加美观、富有设计感。

在中文写作任务方面，新版V3模型基于R1的写作水平进行进一步优化，同时特别提升了中长篇文本创作的内容质量。

此外，新版V3模型可以在联网搜索场景下，对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

其他方面，该模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

据DeepSeek介绍，DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型，仅改进了后训练方法。

私有化部署时只需更新checkpoint和tokenizer_config.json（tool calls 相关变动）。

模型参数约660B，开源版本上下文长度为128K（网页端、App和API提供64K上下文）。

与DeepSeek-R1保持一致，此次DeepSeek开源仓库（包括模型权重）统一采用MIT License，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek V3小版本大升级：推理、前端开发加强这些能力超越GPT-4.5

（举报）

相关推荐

关键词：

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

AI圈虽然天天卷，但是很多的模型，真的越来越无聊了。每天就是跑分又多了几个点。直到昨天，DeepSeek久违的发了一个新模型。 DeepSeek-OCR。这玩意，是真的有点酷。

DeepSeek-OCR AI模型 OCR技术
DeepSeek开源3B OCR模型：长文本识别达97%精度

DeepSeek在GitHub开源新一代OCR模型，采用创新光学二维映射压缩技术，在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌，较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率，显著优于同类模型。该技术路径为OCR系统小型化提供解决方案，其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

DeepSeek-OCR 光学二维映射压缩长文本识别
中国AI算力突围：东方超算Deep X算力盒子超国际竞品82%，重新定义行业标准

中国公司东方超算发布Deep X G20系列AI工作站，在MLPerf测试中性能超越NVIDIA DGX Spark达82%，价格持平，实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡，AI算力达1824 TOPS，体积仅2.7L。通过三大技术创新实现突破：智能异构计算引擎提升资源利用率40%；统一推理运行时支持多框架；深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断，已在量化金融、医疗影像等领域实现显著投资回报，标志着中国AI硬件实现重要突破。
WEEX反诈指南：提升警觉，防范高收益陷阱

近年来数字资产市场快速发展，但网络诈骗层出不穷，包括仿冒交易平台、高收益投资骗局和假客服等手段。WEEX以安全为本，通过多重加密、冷热钱包分离、多因素身份验证等技术防护，结合反诈教育和实时监控系统保护用户。文章提醒投资者警惕高收益承诺，不点击陌生链接，不泄露验证信息，仅通过官方渠道下载APP，强调安全需平台与用户共同维护。

数字资产安全防范投资安全
苹果M5芯片正式发布：CPU提升15%、图形性能提升30%！

苹果正式发布了其全新的M5处理器，这款芯片基于台积电的N3P制程工艺，配备了10核CPU和10核GPU。从CPU来看，M5采用了与M4相同的10核配置，不同的是采用了6个性能核心和4个效率核心，虽然核心数量没有变化，但苹果表示M5的CPU的多线程性能相比M4提高了15%。在GPU方面，M5配备了10核GPU

M5处理器台积电N3P制程 10核CPU
DeepSeek-V3.2-Exp正式发布

DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp，该模型基于V3.1-Terminus升级，引入创新的稀疏注意力机制DSA，首次实现细粒度稀疏注意力，在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面，官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整：输入缓存0.2元、输入未缓存2元、输出3元，开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

DeepSeek-V3.2-Exp 稀疏注意力机制 DSA
技嘉发布X3D系列主板：专为AMD X3D处理器打造，游戏性能提升高达25%

技嘉推出专为AMD Ryzen X3D处理器优化的X870E AORUS X3D系列主板，首发型号包括MASTER与PRO两款。该系列搭载X3D鸡血模式2.0技术，通过AI智能场景识别可自动优化处理器性能，游戏性能最高提升25%。主板采用全快易拆设计，配备免螺丝M.2插槽、磁吸散热装甲及一键拆卸显卡插槽。集成AI黑科技2.0支持DDR5内存超频至9000MT/s+，预装网卡驱动实现开机即联网。两款主板均提供4年质保（含1年免费换新），现已在各大电商平台上市。

技嘉主板 AMD Ryzen
京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

京东在11.11大促期间升级直播技术，推出“立体3D技术”和“JoyAI大模型”等创新，打破传统直播边界。立体3D技术实现裸眼360度商品展示，用户无需额外设备即可旋转查看产品细节；虚拟偶像Aura等跨次元互动增强趣味性。AI全链路工具简化主播运营，提升内容创作效率。这些举措为用户带来沉浸式购物体验，引领直播电商技术革新方向。

京东11.11 立影3D技术 JoyAI大模型
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
火山 AI 搜索引擎升级：大模型时代重塑用户体验与业务增长

火山引擎近日升级企业级AI搜索助手，底层模型升级至豆包大模型1.6，全面提升搜索、推荐、问答能力。该平台支持“开箱即用”，企业可快速构建专属对话式搜索助手，已在电商导购、视频新闻、AI搜图、智能硬件等多场景落地，帮助优化产品体验，为业务增长注入新动能。

火山AI搜索引擎豆包大模型1.6 企业级搜推AI助手

今日大家都在搜的词：

热文

3 天
7天

DeepSeek V3小版本大升级：推理、前端开发加强这些能力超越GPT-4.5

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

DeepSeek开源3B OCR模型：长文本识别达97%精度

中国AI算力突围：东方超算Deep X算力盒子超国际竞品82%，重新定义行业标准

WEEX反诈指南：提升警觉，防范高收益陷阱

苹果M5芯片正式发布：CPU提升15%、图形性能提升30%！

DeepSeek-V3.2-Exp正式发布

技嘉发布X3D系列主板：专为AMD X3D处理器打造，游戏性能提升高达25%

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

火山 AI 搜索引擎升级：大模型时代重塑用户体验与业务增长

今日大家都在搜的词：

热文

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

华为鸿蒙HarmonyOS 6公测版开启推送

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

REDMI K90标准版外观公布：屏幕视觉四等边

华为余承东：鸿蒙5终端设备数量突破2300万

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

余承东官宣华为路由X3 Pro 采用“日照金山”设计

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

站长商机

DeepSeek V3小版本大升级：推理、前端开发加强 这些能力超越GPT-4.5

今日大家都在搜的词：

热文

站长商机

DeepSeek V3小版本大升级：推理、前端开发加强这些能力超越GPT-4.5