首页 > 传媒 > 关键词  > 百度智能云最新资讯  > 正文

百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

2025-10-28 14:43 · 稿源: 站长之家用户

10月28日,百度智能云宣布携手SGLang 社区,将一套针对DeepSeek-V3.2推理性能优化的 MTP(Multi-Token Prediction,多token预测)技术代码正式开源。SGLang 社区实测显示,采用这套技术, DeepSeek-V3.2模型解码吞吐量能提升超过2倍。

据了解,这套技术代码来自于百度智能云内部百舸AI计算平台团队。代码开源之前也已经在百度内部核心业务中长期运行,性能与稳定性上均经过严苛考验。社区用户可以结合自身业务场景,“开箱即用”地使用这套代码能力。

今年年初,DeepSeek以低成本和高性能横空出世,迅速吸引全球科技圈关注。而MTP正是其实现这一效果的核心技术创新之一。

在DeepSeek之前,大模型和推理多采用传统的自回归解码方式,模型每次只生成一个 token,生成下一个时必须等待上一个完成。如同逐字输入,过程稳定但速度存在瓶颈。

MTP则采用的是批量生成、集中验证的机制。模型会一次性智能地推算出多个后续 token 作为候选,然后统一进行验证。这好比从逐字输入升级为智能联想输入,一次性能提供多个候选词句,从而大幅减少生成轮次,突破序列化瓶颈。

在训练阶段,MTP有助于大模型更好地理解词元之间的依赖关系,从而提升大模型整体性能;在推理阶段,MTP快速生成多个候选词元,并由主模型进行一次前向传播来验证和修正,从而实现推理加速。

作为模型的配套技术,MTP需要与大模型自身的架构保持深度适配。这也导致最新的 DeepSeek-V3.2由于采用了与过往不同的的 DSA(DeepSeek Sparse Attention,稀疏注意力)架构,使得此前适用于 DeepSeek 老版本的 MTP 代码无法直接复用于 DeepSeek-V3.2,急需全新的系统级优化和深度适配工作。

百度百舸团队此次开源的MTP 方案,与 DeepSeek-V3.2的 DSA架构进行了深度适配,并在百度集团内部业务中进行了生产级场景的完整验证。此次开源,使得 SGLang 社区开发者无需重复底层探索与试错,能够直接获得性能倍增且稳定可靠的推理能力。

未来,百度百舸团队将持续开源生产级别核心代码,方便中小企业及开发者快速、稳定、低成本地部署先进AI能力,加速创新落地。

百度百舸AI计算平台是百度智能云打造的面向大模型训推一体化的基础设施,可以从资源准备、模型开发、模型训练到模型部署,为AI工程全周期提供丰富特性和极致易用体验。今年8月,百度智能云正式发布百度百舸5.0,在网络、算力、推理系统,以及训推一体系统等四大方向上全面升级,并正式上线了昆仑芯超节点公有云服务。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • DeepSeek同时发布两个正式版模型:DeepSeek-V3.2系列发布

    今日,DeepSeek正式推出V3.2系列模型,包含标准版DeepSeek-V3.2与长思考增强版DeepSeek-V3.2-Speciale。此次更新不仅在推理性能上实现重大突破,更通过创新性技术架构重新定义了开源模型的能力边界。 目前,官方网页端、移动应用及API服务已全面升级至V3.2标准版,而Speciale版本则以临时API形式开放供学术研究使用。 DeepSeek-V3.2在平衡推理效率与输出质量方面

  • “2025年度字词”即将出炉:DeepSeek、草台班子入选

    汉语盘点2025”活动日前发布年度字词”的候选前五位字词。 汉语盘点2025”包括国内字、国内词、国际字、国际词四大板块,其中DeepSeek”和草台班子”分别入选国内词和国际词的候选名单。 前五位年度国内候选字:韧”创”融”智”通” 前五位年度国内候选词:十五五”深度求索(DeepSeek)”九三阅兵”苏超”具身智能”

  • V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

    ​就在上周,OpenAI前首席科学家、现SSI CEO Ilya Sutskever在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。 然而仅过了几天,12月1日,DeepSeek用V3

  • DeepSeek创始人梁文锋入选《自然》年度十大科学人物

    《自然》杂志发布2025年度十大科学人物榜单,中国在人工智能与深海科学领域表现突出。深度求索创始人梁文锋及中科院深海科学家杜梦然入选。榜单特别指出,DeepSeek推出的R1大模型以开放权重形式发布,推动行业向更开放共享方向发展。该模型在多项能力上媲美顶尖模型,训练成本却远低于竞争对手。今年9月,梁文锋团队相关研究登上《自然》封面,回应了外界质疑,为行业树立了新标杆。

  • 网易有道词典2025年度词汇发布:DeepSeek当选!

    网易有道词典今天发布了2025年度词汇,deepseek以8672940次的年度搜索量成功当选。 有道词典表示,今年1月份,DeepSeek发布了深度推理模型R1,在复杂逻辑、数学与代码领域的表现跻身全球顶尖,并宣布全面开源。 这也使得2025年deepseek在有道词典的全球搜索量从0跃升至8672940,涨幅创下历史新高。

  • AI日报:快手可灵 2.6 全量上线;字节Seedream 4.5发布;DeepSeek连发两款新模型

    本文汇总了AI领域最新动态:快手可灵2.6上线,实现“音画同出”生成视频;字节跳动发布Seedream4.5,提升多图一致性生成;豆包助手回应权限争议并下线微信操作功能;智源研究院推出多模态世界模型Emu3.5,可预测真实世界状态;研究揭示AI模型能发现并利用智能合约漏洞;小米公布AI战略,押注“AI+物理世界”融合;谷歌发布Workspace Studio,助力企业构建AI代理;DeepSeek同步上线V3.2与Speciale两款新模型,展示开源实力。

  • AI日报:可灵Avatar 2.0 上线;谷歌推出Gemini 3 Deep Think模式;阿里云析言 XiYan-SQL 强势夺冠

    本期AI日报聚焦多项AI技术突破:Kling AI Avatar 2.0上线,实现数字人表情动作智能生成;谷歌推出Gemini 3 Deep Think模式,显著提升AI推理能力;微软发布轻量级实时语音模型VibeVoice 0.5B;OpenAI最强编码模型GPT-5.1-CodexMax全面接入API;阿里云“析言 XiYan-SQL”在SQL诊断评测中夺冠。此外,豆包助手调整AI操作能力,谷歌将展示Android XR平台更新。

  • 免费AI搜索指数平台DeepGEO上线,国内首创geo指数分析服务

    国内首个专注AI搜索指数分析及品牌产品排名的专业工具DeepGEO平台正式上线,核心功能全部免费开放。该平台融合百度指数等权威数据与自研AI预测算法,提供多维、跨平台的AI搜索行为分析,填补了市场空白。用户可免费查询各类AI产品、技术及企业的综合搜索指数与口碑排名,并获取趋势洞察与未来热点预测。平台旨在降低AI行业数据分析门槛,赋能创业者、投资者及研究者,推动产业健康发展。

  • 报名开启 | 「2025 Meet・未来系列活动:全球AI前瞻者大会」顶尖专家共探技术与产业新局

    12月16日,中关村东升科技园将举办“未来系列”活动,聚焦AI体系化落地关键节点,探讨行业治理与伦理等核心议题。活动汇聚领军专家、科创先锋等多方力量,共研“AI+”价值落地路径,旨在夯实中国AI全球竞争力。亮点包括:全球前沿视角探讨AI从单点突破到体系化落地;高端对话平台促进产学研深度交流;聚焦AI与实体经济融合的价值创造;立足国内“AI+”战略推进现状,链接全球产业动态。活动面向科技企业创始人、高管、科创创业者、投资人及行业研究者等,席位有限。

  • 海尔厨电2026开盘会发布AI新品“Seeker”

    12月6日,海尔厨电在苏州发布2026新品,推出AI厨房套系“Seeker”,标志着其全面向ToC转型。新品赋予厨房电器视觉与思考能力,通过AI之眼观察、语音交流、大脑思考,实现智能联动。其中,升降隐形油烟机首创双升降系统,配合AI调节吸力;微蒸烤一体机利用AI视觉识别食材,提升烹饪效率;洗碗机搭载四驱双面洗科技,智能识别污渍并精准投放洗涤剂。整体上,Seeker套系通过全域ToC战略和智能化转型,深度响应用户需求,驱动市场增长。2025年上半年,海尔厨电全球销量已超800万台,为全年再创新高奠定基础。

今日大家都在搜的词: