首页 > AI头条  > 正文

性能跃迁,幻觉清零!中国移动“九天”3.0震撼登场,多项核心技术同步开源

2025-07-29 11:23 · 来源: AIbase基地

7月26日,在2025世界人工智能大会“AI 焕新 产业共赢”企业人工智能产业发展论坛上,中国移动隆重发布了其自主研发的 “九天”基础大模型3.0。此次发布不仅彰显了中国移动在大模型领域的深厚自研实力和持续创新能力,更标志着其在人工智能产业化发展道路上迈出了坚实一步。

人工智能大脑,大模型

作为国务院国资委战新“百大工程”的重要成果,“九天”基础大模型3.0在继承“高安全、高可控、全国产、全行业”四大特性的基础上,实现了三大关键“焕新”:

一、九天众擎语言大模型:架构与性能双重跃迁

“九天众擎语言大模型”实现了架构上的突破性创新,采用可扩展至万亿级的 MoE 架构。通过15T token 的多阶段配比预训练数据与全流程治理体系,其推理能力得到显著强化。该模型还创新构建了113域 ×53能力的二维分级后训练框架,结合动态强化学习策略,使复杂推理能力提升了 35%

权威榜单评测中,“九天”语言大模型成绩斐然:

  • GPQA-Diamond 评测中,以 77.67分斩获全球第二,超越 DeepSeekR1和 Qwen3。

  • ArenaHard V1.0 中,以 67.2分位居全球第一

  • BFCL V3 评测中,达到 68分

在性能大幅跃升的同时,模型进一步强化了可控生成能力,通过精确流程内置等技术细节,实现了专业场景下的零幻觉,破解了沉浸式角色演绎难题。

基于最新的语言大模型,中国移动还同步推出了多个专项模型:

  • 九天代码大模型: 采用两阶段持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等任务,覆盖 Python、Java、JS、TS、Go、C++ 等10余种主流编程语言。在 EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上表现领先。

  • 九天数学大模型: 在短思考、长思考模式下均达到业界 SOTA 水平,多项指标超越 Qwen2.5Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill 等同参数量级模型。

二、九天善智多模态大模型:生成可控性与理解能力全面提升

“九天善智多模态大模型”引入复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新技术。同时,通过融合多模态理解信息和联合图文交织数据训练,显著提升了模型对文本指令和输入条件图像视频的感知能力。这意味着模型不仅能生成高质量的图像视频,还能进行多轮对话式高可控精确编辑操作,大幅提升了视觉生成的灵活便利性。例如,在图片生成方面可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。

模型的图理解和视频理解性能也得到了全面提升:

  • 图理解方面: 在 MMStar、HallusionBench 和 OCRBench 等图理解任务中,九天模型分别获得了 82.2、64.3和94.9的高分,处于业界领先水平。

  • 视频理解方面: 在 Videomme 和 MVbench 两个任务中均表现领先,超越 Qwen2-VL 和 InternVideo2。

三、模型及核心技术开放开源,助力产业生态发展

中国移动此次还采取了开放策略,将多项模型及核心技术进行开源,旨在推动行业共同发展:

  1. 开源九天数童结构化数据大模型: 包括 JT-DA-8B 模型及后续演进版本,支持下载模型权重、微调代码、推理代码等。

  2. 开源九天数学大模型: 包括 JT-Math-8B 系列模型,支持下载模型权重、推理代码、技术报告。

  3. 开源九天代码大模型: 包括 JT-Coder-8B 系列模型,支持下载模型权重、推理代码、技术报告。

  4. 开源业界首创的结构化数据模型评测数据及 TReB 评测体系: 涵盖6大任务、34个能力,包括高质量、全面的数据、推理模式及评价指标,支持下载评测数据集、测试代码。

  5. 开源 CCR-Bench 行业场景复杂指令遵循评测数据集: 包含174条高质量、多样化、高难度复杂指令数据,高度模拟健康专家、智能客服、医疗助手等典型工业场景,支持下载数据集。

以上所有开源内容均已上线焕新社区、Github、HuggingFace、魔搭社区、Gitee 和 Arxiv,将为开发者和研究人员提供宝贵的资源,共同加速人工智能技术的创新与应用。

  • 相关推荐
  • 直击2025中国互联网大会,看中国移动数智创新“加速度”

    2025年中国互联网大会在北京国家会议中心盛大开幕。中国移动展示了5G-A网络智能化、6G智能体通信、算网一体等创新成果,推出"通感算智一体化"方案,显著提升网络性能。在低空智联领域,打造全球首个5G-A通感一体试验网,满足物流配送等多元需求。AI赋能方面,推出专利大模型和"一句话自动创建智能体"平台,降低AI使用门槛。现场还展示AI+移动云盘、AI合拍

  • 国内eSIM回归!OPPO Watch X2系列上线中国移动一号双终端

    一号双终端业务是指用户可以在自己手机号码(主号码)的账户和套餐下,添加手表作为eSIM附属设备(副卡),使手机和手表共用一个号码,共享号码、套餐通话和流量,可分别通话、上网。 如果没有随身携带手机,用户可以通过开通eSIM业务的智能手表进行通话,也不用担心错过重要通话。 这两年国内eSIM业务逐步收紧,很多新的设备已经无法重新开通,现在终于开始重新�

  • AI日报:可灵发布灵动画布创意工作台;Coze Studio和Loop正式开源;WPS AI 3.0灵犀版本发布

    【AI日报】汇总了近期AI领域重要动态:1)字节跳动开源Coze两大核心项目,降低AI开发门槛;2)可灵AI发布"灵动画布"创意工作台,创作者突破4500万;3)Runway推出视频编辑模型Aleph,支持自然语言指令操作;4)金山办公发布WPS AI 3.0,实现智能文档创作;5)京东升级大模型品牌JoyAI;6)浦东设立20亿AI种子基金;7)阿里开源WebSailor框架提升信息检索效率;8)我国大模型数量突破1500个,居全球领先;9)蚂蚁数科联合发布金融大模型评测基准;10)腾讯开源混元3D世界模型,支持360°场景生成。

  • AI仙侠玄幻剧:用离谱和技术给你们一点震撼

    凤凰男成“下蛋”工具、龙女一言不合就“炖妖”补身、“男妈”一胎诞下一窝小狐狸、“万妖窟”男团惨变“火锅底料”、铺垫老半天的“大boss”竟是Labubu……比离谱更离谱的AI仙侠玄幻短剧悄悄地火了。 《遮天》首播即爆,全网话题量破亿;抖音账号“梦婆婆”连载的《九尾狐男妖爱上我》目前累计播放量已超1.1亿,冲上抖音+快手短剧综合热度榜TOP20,“癫”感十足的剧�

  • 汽车存储新势力,中国存储企业江波龙如何以技术突围

    随着智能网联汽车快速发展,汽车存储产品成为支撑自动驾驶、智能座舱等功能的关键基础设施。全球汽车存储市场规模预计从2021年45亿美元增至2027年125亿美元,年复合增长率18.6%。江波龙通过芯片设计、存储定制等布局,构建汽车存储技术体系,自主研发WM6000主控芯片,支持高速模式,容量达128GB,符合车规级可靠性标准。其产品覆盖智能座舱、ADAS等10余个车载场景,与20余家主机厂建立合作,累计装机量突破千万级。公司前瞻布局车规级存储领域,推出eMMC、UFS等多类产品,构建从芯片到系统的完整生态,成为汽车存储领域标杆企业。

  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • 腾讯高管称内部30%代码都由AI在写 700多项业务接入AI

    今日上午,在2025世界人工智能大会Tencent AI Talk智能涌现”论坛上,腾讯副总裁蔡学忠表示,腾讯坚定看好AI的长期价值,目前内部已有700多项业务接入AI技术。 据介绍,在腾讯内部,30%已经是AI在写代码,整体编码效率提升了16%。 蔡学忠分享了打造好用AI的三点思考: 首先是需要坚实的模型基础,不仅是参数和算力的比拼,更是工程化能力和成本效率的较量。 其次强调AI开�

  • 开源赋能·智领未来 青山工业与深蓝汽车技术开源共享生态建设

    深蓝汽车首创"微核高频脉冲加热技术",有效解决电动车低温续航短、充电慢、动力弱等痛点,加热速率提升200%以上,达到国际领先水平。该技术通过电池内部产生脉冲电流实现自加热,无需额外硬件,已获中国专利金奖。2024年5月,深蓝宣布将相关专利群开源,与青山工业等合作伙伴共建产业生态。实测显示,-30℃环境下电池温升超4℃/min,动力性能提升55%,充电时间

  • 杰克30年:见证从行业领跑者到产业引领者的跃迁

    杰克集团将在7月18日举办30周年庆典暨全球科技大会,标志着其从缝纫设备制造商成功转型为服装智能制造解决方案服务商。30年来,杰克构建了覆盖爆品矩阵、数字成套、人才培养、联合创新、全球产业链布局与绿色发展的全维度生态体系。其"快反王"系列破解服装生产赶单难题,"过梗王"运用AI解决面料卡顿问题,数字成套方案助力服装企业数字化转型。杰克拥有千余人研发团队,布局14个全球研发中心,连续12年专利申请量行业第一。产品销往170多个国家地区,连续14年全球销量第一。近日获万得ESG评级AA级,彰显可持续发展领导力。此次大会或将成为杰克从行业标杆向产业领航者跨越的历史拐点。

  • 视觉中国战投企业景致三维:启动深圳首家3D数字技术订单班

    视觉中国战略投资企业景致三维联合深圳携创高级技工学校,于2025年7月22日启动深圳首家"3D梦工场订单班"。该项目针对3D数字技术人才缺口,定向培养逆向工程师、动画师、渲染师等紧缺人才。课程引入亚马逊、京东等真实商业项目案例,学生将系统学习3ds Max、Maya等主流工具,并考取职业资格证书。学习期间企业提供奖学金和带薪实习,毕业生考核合格可直接入职景�

今日大家都在搜的词: