首页 > AI头条  > 正文

DeepSeek V3.2 双模型发布:线性复杂度长文本 + 无惩罚深度思考,开源阵营再冲第一梯队

2025-12-03 09:40 · 来源: AIbase基地

DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示:

- V3.2在128k 上下文场景下与 GPT-5互有胜负

- V3.2-Speciale 在 MMLU、HumanEval 等基准中与 Gemini3Pro 打平,IMO2025盲测获金牌分数线83.3%

转正稀疏注意力(DSA)是核心升级:通过“目录”式路由token,将长文本计算复杂度从O(n²)降至O(n),显存占用下降40%,推理速度提升2.2倍,首次在开源模型实现百万token单卡推理。

image.png

后训练环节,团队把>10%整群算力投入强化学习,采用组对强化学习(GRPO)+多数投票,让模型在代码、数学与工具调用任务上逼近闭源对手。V3.2-Speciale取消“思考长度惩罚”,鼓励更长链式推理,平均输出token较Gemini3Pro高32%,但准确率提升4.8个百分点。

image.png

模型已上线GitHub与Hugging Face,权重采用Apache2.0协议,允许商业化。DeepSeek表示,下一步将开源长文本DSA内核与RL训练框架,继续把“闭源优势”转化为社区基础设施。行业评论称,若后续版本保持迭代节奏,开源阵营有望在2026年前实现“长文本+推理”双重领先。

  • 相关推荐
  • DeepSeek同时发布两个正式版模型:DeepSeek-V3.2系列发布

    今日,DeepSeek正式推出V3.2系列模型,包含标准版DeepSeek-V3.2与长思考增强版DeepSeek-V3.2-Speciale。此次更新不仅在推理性能上实现重大突破,更通过创新性技术架构重新定义了开源模型的能力边界。 目前,官方网页端、移动应用及API服务已全面升级至V3.2标准版,而Speciale版本则以临时API形式开放供学术研究使用。 DeepSeek-V3.2在平衡推理效率与输出质量方面

  • V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

    ​就在上周,OpenAI前首席科学家、现SSI CEO Ilya Sutskever在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。 然而仅过了几天,12月1日,DeepSeek用V3

  • “2025年度字词”即将出炉:DeepSeek、草台班子入选

    汉语盘点2025”活动日前发布年度字词”的候选前五位字词。 汉语盘点2025”包括国内字、国内词、国际字、国际词四大板块,其中DeepSeek”和草台班子”分别入选国内词和国际词的候选名单。 前五位年度国内候选字:韧”创”融”智”通” 前五位年度国内候选词:十五五”深度求索(DeepSeek)”九三阅兵”苏超”具身智能”

  • DeepSeek创始人梁文锋入选《自然》年度十大科学人物

    《自然》杂志发布2025年度十大科学人物榜单,中国在人工智能与深海科学领域表现突出。深度求索创始人梁文锋及中科院深海科学家杜梦然入选。榜单特别指出,DeepSeek推出的R1大模型以开放权重形式发布,推动行业向更开放共享方向发展。该模型在多项能力上媲美顶尖模型,训练成本却远低于竞争对手。今年9月,梁文锋团队相关研究登上《自然》封面,回应了外界质疑,为行业树立了新标杆。

  • AI日报:快手可灵 2.6 全量上线;字节Seedream 4.5发布;DeepSeek连发两款新模型

    本文汇总了AI领域最新动态:快手可灵2.6上线,实现“音画同出”生成视频;字节跳动发布Seedream4.5,提升多图一致性生成;豆包助手回应权限争议并下线微信操作功能;智源研究院推出多模态世界模型Emu3.5,可预测真实世界状态;研究揭示AI模型能发现并利用智能合约漏洞;小米公布AI战略,押注“AI+物理世界”融合;谷歌发布Workspace Studio,助力企业构建AI代理;DeepSeek同步上线V3.2与Speciale两款新模型,展示开源实力。

  • 网易有道词典2025年度词汇发布:DeepSeek当选!

    网易有道词典今天发布了2025年度词汇,deepseek以8672940次的年度搜索量成功当选。 有道词典表示,今年1月份,DeepSeek发布了深度推理模型R1,在复杂逻辑、数学与代码领域的表现跻身全球顶尖,并宣布全面开源。 这也使得2025年deepseek在有道词典的全球搜索量从0跃升至8672940,涨幅创下历史新高。

  • 海尔厨电2026开盘会发布AI新品“Seeker”

    12月6日,海尔厨电在苏州发布2026新品,推出AI厨房套系“Seeker”,标志着其全面向ToC转型。新品赋予厨房电器视觉与思考能力,通过AI之眼观察、语音交流、大脑思考,实现智能联动。其中,升降隐形油烟机首创双升降系统,配合AI调节吸力;微蒸烤一体机利用AI视觉识别食材,提升烹饪效率;洗碗机搭载四驱双面洗科技,智能识别污渍并精准投放洗涤剂。整体上,Seeker套系通过全域ToC战略和智能化转型,深度响应用户需求,驱动市场增长。2025年上半年,海尔厨电全球销量已超800万台,为全年再创新高奠定基础。

  • 免费AI搜索指数平台DeepGEO上线,国内首创geo指数分析服务

    国内首个专注AI搜索指数分析及品牌产品排名的专业工具DeepGEO平台正式上线,核心功能全部免费开放。该平台融合百度指数等权威数据与自研AI预测算法,提供多维、跨平台的AI搜索行为分析,填补了市场空白。用户可免费查询各类AI产品、技术及企业的综合搜索指数与口碑排名,并获取趋势洞察与未来热点预测。平台旨在降低AI行业数据分析门槛,赋能创业者、投资者及研究者,推动产业健康发展。

  • AI日报:可灵Avatar 2.0 上线;谷歌推出Gemini 3 Deep Think模式;阿里云析言 XiYan-SQL 强势夺冠

    本期AI日报聚焦多项AI技术突破:Kling AI Avatar 2.0上线,实现数字人表情动作智能生成;谷歌推出Gemini 3 Deep Think模式,显著提升AI推理能力;微软发布轻量级实时语音模型VibeVoice 0.5B;OpenAI最强编码模型GPT-5.1-CodexMax全面接入API;阿里云“析言 XiYan-SQL”在SQL诊断评测中夺冠。此外,豆包助手调整AI操作能力,谷歌将展示Android XR平台更新。

  • 华为FreeClip 2耳夹耳机海外发布:1649元比国内贵不少

    华为今天在迪拜举办全球发布会,正式发布了华为Mate X7、华为FreeClip 2等新品。 其中,华为FreeClip 2定价是199欧元,约合人民币1649元,比国内的1299元贵了不少。 此前华为推出的初代FreeClip就备受关注,佩戴和音质表现都非常不错,发布一年多也是几乎无敌手,二代又进一步升级。 华为FreeClip 2采用华为全新第三代自研低功耗芯片,首次引入NPUAI处理器,算力提升10倍。 配备自

今日大家都在搜的词: