首页 > 传媒 > 关键词  > 中国联通最新资讯  > 正文

大规模专家并行推理集群实现性能3倍跃迁,联通元景开启推理新纪元

2025-04-07 19:36 · 稿源: 站长之家用户

近日,中国联通持续技术攻坚,依托元景大模型MaaS平台成功搭建“大规模专家并行” 推理集群,实现DeepSeek MoE 大模型在多节点间的超有效集群推理,单卡吞吐提升 3 倍,解码时延降低 50%。这一成果不仅为人工智能技术的创新发展提供了强大助力,也让各行业以更有效率应用 AI 技术,加速推动千行百业的数字化转型

伴随大模型MoE结构重大技术革新,以往少量“全能型”专家的模式逐渐被取代,大量“专科型”小专家逐渐成为主流。这一转变,极大地提升了模型的针对性和精细化程度,使得模型效果显著改善。

推理应用在各行业的落地随之全面加速,市场对于推理服务的需求呈井喷式增长,Tokens 处理量的需求与日俱增,这对推理系统的性能提出了更高的要求。为应对这一挑战,大规模专家并行推理技术应运而生,为大模型推理的加速规模应用提供了强大的技术支撑。

联通元景大模型与昇腾深度合作,围绕大规模专家并行推理技术展开全方位创新,将 DeepSeek 671B满血版大模型的数百个“专科型” 小专家按特出方式分布到不同的NPU上,使得单卡权重占用显存降低 75%,权重加载耗时大幅减少,可用于数据计算的显存显著增加。

在通信环节,双方对集群跨机通信方案进行深度优化,通过引入先进计算与通信并行算法,整体通信效率提升40%。此外,双方联合创新多级负载均衡算法,准确识别并均衡各NPU 的负载,将卡间负载差异成功控制在 10% 以下,有效提升系统吞吐和计算资源利用率。

联通元景大模型MaaS平台结合大规模专家并行推理集群系统,基于DeepSeek 671B 满血版大模型持续进行针对性推理优化创新,打造高可靠、高性能、易运维推理服务。

围绕高可靠

依托实例内和实例间的多级容灾机制,保障业务连续性,提供长稳推理服务。围绕高性能,进行高并发请求调度、管理、转发等,打造整个集群的有效数据请求管理入口。

围绕易运维

进行集群内推理业务状态监控、以及PD身份和资源管理与决策等,打造整个推理集群的状态监控器和决策大脑,持续提升大规模专家并行推理集群易用性。

在数字经济蓬勃发展的浪潮中,中国联通始终勇立潮头,全面发力人工智能。从精心搭建智算基础设施,构建强大算力“引擎”,到成功落地大规模专家并行推理集群,打造高性能低时延推理“中枢”,联通元景大模型持续筑牢国产化智算底座,以技术需求双轮驱动,打造“普惠速成”的元景MaaS平台,让人工智能更简单,为 AI 产业发展注入强劲的“加速度”。

这一推理创新举措必将助力各行业在复杂多变、竞争激烈的市场环境中抢占先机,以智能化驱动数字化转型,进而推动实体经济高质量发展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

    要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。 它的巧妙之处,就在于把不同的任务分配给擅长处理的专家网络,让整个系统性能得以提升。 但你知道吗? 正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。 因为在大量任务来临之际(尤其是超大规模时),MoE并不是以“雨露均沾”的方式去分配——专家网络们的负�

  • 非农超级周大幕即将开启!皇御环球3倍积分掀黄金交投热潮

    中美经贸会谈后黄金避险吸引力消退,但全球金融市场仍面临地缘政治和经济不确定性,金价波动或将持续。

  • 李未可AI眼镜新品发布会:零级智能体开启人机交互新纪元

    李未可科技发布2025年度新品,推出三款AI智能眼镜及专属大模型"WAKE-AI任务式交流系统"。核心亮点是"零级智能体ZeroAgent",通过多智能体协同实现任务分发与动态决策,打破传统硬件依赖单一AI功能的局限。新品包括轻量化设计的LAWK City系列(续航14小时,仅重23-27克)和旅拍版LAWK View(支持20种语言翻译)。公司联合米奥兰特国际会展瞄准跨境商务场景,并与博士眼镜达成战略合作,推动AI眼镜线下体验。创始人茹忆强调"AI定义硬件"理念,预测未来十年传统眼镜将全面智能化,轻量化、长时佩戴与场景适配是竞争核心。

  • 苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

    有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 苹果团队认为,现有评估主要集中在既定的数学和编码基准上,看模型最终答案是否正确,但可能存在模型训练时见过类似题目。 并且,这些评估大都缺乏对思考过程质量”的分析,比如中间步骤是否逻辑一致、是否绕弯路等。 为了更客观测试推理模型的推理能力,他们设计了4类谜题环境:汉诺塔、�

  • 三星Galaxy Z系列新纪元:纤薄轻盈,持久耐用

    三星基于用户需求持续创新,2019年推出首款Galaxy Fold折叠屏手机,开创了智能手机新形态。通过融合便携性与平板生产力,颠覆传统认知。三星从其他工业领域汲取灵感,研发耐用铰链技术和柔性屏幕,深度整合创造力与生产力,解锁移动设备更多可能性。新一代Galaxy Z系列将更轻薄耐用,带来更流畅的多任务处理和沉浸式内容创作体验。折叠屏手机正突破边界,即将迎来更纤薄轻盈、质感出众的新里程碑,令人期待的Ultra体验也将在折叠屏上展开。

  • 雷军:小米自研玄戒O1 3nm芯片已开始大规模量产

    小米将于5月22日发布搭载自研3nm旗舰芯片"玄戒O1"的两款新品:小米15S Pro和小米平板7 Ultra。小米15S Pro延续15 Pro设计,配备6.73英寸2K LTPO屏幕、6100mAh电池、90W快充,搭载Summilux三摄系统,支持8K视频拍摄。小米平板7 Ultra采用14英寸刘海屏,支持120W闪充,有望成为小米史上最强平板。两款产品均采用超窄边框设计,标志着小米自研芯片进入3nm时代。

  • DeepSeek更新R1推理AI模型,已发布Hugging Face

    更新后的 R1 拥有 6850 亿个参数,体量庞大。由于模型规模极大,普通消费者级别的硬件很可能无法直接运行。

  • 雷军再造爆款车!小米YU7留资用户数是SU7同期的3倍

    小米汽车第二款车型YU7在投资者大会上公布数据:截至5月25日,YU7留资用户数是SU7同期的3倍,超60%为首次留资用户,40%未使用过小米产品。新车延续SU7高颜值设计,配备三块Mini+LED天幕屏、激光雷达、800V高压架构等高端配置,四驱版零百加速3.23秒,CLTC续航最高835km。雷军现场对比特斯拉Model Y,强调YU7配置价值超六七万。虽未公布售价,但预计将冲击Model Y市场份额。新车凭借科技感与性能优势,有望成为爆款。

  • itc保伦股份“AI教育3.0·智慧教育新纪元”线上推介会圆满举办,以科技之光照亮教育未来!

    ITC保伦股份举办"AI教育3.0·智慧教育新纪元"线上推介会,发布三大AI教育解决方案:1)智慧教学方案通过AI重构课堂,实现声学环境优化、课堂行为洞察等功能;2)智慧操场方案运用机器视觉技术,实现运动姿态分析、成绩智能判定;3)平安校园方案构建三维立体防护网络,实现智能监控与语音预警。活动吸引4.5万人次观看,专家陈晓华指出AI教育需强化技术创新、数据安全和教师培训。ITC将持续深耕"AI+教育"领域,推动教育信息化高质量发展。

  • OpenAI 提升o3多模态模型推理实力,微美全息(WIMI.US)加速引领产业新变革征程

    OpenAI推出突破性的o3推理模型,首次实现图像直接融入推理过程,在多模态基准测试V* Bench上准确率达95.7%。DeepSeek完成R1模型升级,上下文窗口从12K扩展至23K,幻觉率降低45%-50%。行业呈现开源趋势,DeepSeek开源策略促使多家企业跟进,OpenAI也考虑开源。微美全息加速布局多模态大模型,计划提供实时多模态AI体验。专家指出AI发展重心正从大模型向智能体演进,开源技术显著降低训练门槛,提升泛化能力,为多模态智能探索开辟新路径。企业需紧跟趋势把握机遇,在大模型驱动的新时代找准定位。