首页 > 传媒 > 关键词  > 中国联通最新资讯  > 正文

大规模专家并行推理集群实现性能3倍跃迁,联通元景开启推理新纪元

2025-04-07 19:36 · 稿源: 站长之家用户

近日,中国联通持续技术攻坚,依托元景大模型MaaS平台成功搭建“大规模专家并行” 推理集群,实现DeepSeek MoE 大模型在多节点间的超有效集群推理,单卡吞吐提升 3 倍,解码时延降低 50%这一成果不仅为人工智能技术的创新发展提供了强大助力,也让各行业以更有效率应用 AI 技术,加速推动千行百业的数字化转型

伴随大模型MoE结构重大技术革新,以往少量“全能型”专家的模式逐渐被取代,大量“专科型”小专家逐渐成为主流。这一转变,极大地提升了模型的针对性和精细化程度,使得模型效果显著改善。

推理应用在各行业的落地随之全面加速,市场对于推理服务的需求呈井喷式增长,Tokens 处理量的需求与日俱增,这对推理系统的性能提出了更高的要求。为应对这一挑战,大规模专家并行推理技术应运而生,为大模型推理的加速规模应用提供了强大的技术支撑。

联通元景大模型与昇腾深度合作,围绕大规模专家并行推理技术展开全方位创新,将 DeepSeek 671B满血版大模型的数百个“专科型” 小专家按特出方式分布到不同的NPU上,使得单卡权重占用显存降低 75%,权重加载耗时大幅减少,可用于数据计算的显存显著增加。

在通信环节,双方对集群跨机通信方案进行深度优化,通过引入先进计算与通信并行算法,整体通信效率提升40%。此外,双方联合创新多级负载均衡算法,准确识别并均衡各NPU 的负载,将卡间负载差异成功控制在 10% 以下,有效提升系统吞吐和计算资源利用率。

联通元景大模型MaaS平台结合大规模专家并行推理集群系统,基于DeepSeek 671B 满血版大模型持续进行针对性推理优化创新,打造高可靠、高性能、易运维推理服务。

围绕高可靠

依托实例内和实例间的多级容灾机制,保障业务连续性,提供长稳推理服务。围绕高性能,进行高并发请求调度、管理、转发等,打造整个集群的有效数据请求管理入口。

围绕易运维

进行集群内推理业务状态监控、以及PD身份和资源管理与决策等,打造整个推理集群的状态监控器和决策大脑,持续提升大规模专家并行推理集群易用性。

在数字经济蓬勃发展的浪潮中,中国联通始终勇立潮头,全面发力人工智能。从精心搭建智算基础设施,构建强大算力“引擎”,到成功落地大规模专家并行推理集群,打造高性能低时延推理“中枢”,联通元景大模型持续筑牢国产化智算底座,以技术需求双轮驱动,打造“普惠速成”的元景MaaS平台,让人工智能更简单,为 AI 产业发展注入强劲的“加速度”。

这一推理创新举措必将助力各行业在复杂多变、竞争激烈的市场环境中抢占先机,以智能化驱动数字化转型,进而推动实体经济高质量发展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • LIFETOO品牌麦角硫因:开启抗衰养颜新纪元

    LIFETOO是一个专注于抗衰老营养健康的品牌,由多位生物学博士创立,依托美日先进营养科学技术研发产品。其明星产品麦角硫因胶囊具有强效抗氧化功效,能改善皮肤状态、增强弹性。品牌拥有专业研发团队和自有生产线,产品通过严格质量控制,在全球多个国家销售并获得消费者认可。LIFETOO坚持"探索营养与健康的未来"理念,致力于为消费者提供高品质、个性化的营养呵护方案。

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。

  • 超聚变探索者大会2025:算力焕新,开启智能新纪元

    4 月 15 日- 17 日,以“共建智能体时代”为主题的超聚变探索者大会 2025 在郑州成功举行。大会汇聚 2500 余名行业领袖、专家、媒体等伙伴及客户,提出并深入探讨智能体时代的发展趋势、驱动要素与价值应用,重磅发布超聚变算力业务、城企数智业务、智慧能源解决方案三大业务领域的全新产品矩阵,共同聚焦技术创新的广阔应用,与全球生态伙伴积极拥抱战略机遇,携手共

  • 新增自主决策推理模型!理想汽车OTA 7.2开启推送

    快科技4月3日消息,我们从理想汽车官方获悉,OTA7.2版本车机系统正式开启推送,预计一周内完成,升级耗时约50分钟。本次更新新增自主决策推理模型,该模型基于车载场景数据及通用推理模型数据打造,可根据问题内容自主决策是否深度思考,面对车控指令等简单问题时,能够保障响应速度。智能座舱方面,新增全能儿童锁功能,支持一键锁定副驾老板键、后排座椅物理按�

  • 生成很强,推理很弱:GPT-4o的视觉短板

    研究显示,GPT-4o在图像理解和推理上表现出色,能生成精美图片,但在基础逻辑测试中表现欠佳,暴露出理解、推断及多步骤逻辑处理的不足。例如,被要求画一只猫时,它先画了狗然后改为猫,但仍存在错误判断。这表明当前AI更像“精确指令机器”,需进一步优化以实现更精细的图像理解和复杂任务处理。

  • 雅迪亮相智联电动车产业重庆峰会,车电协同创新开启智能新纪元

    4月22日世界地球日之际,重庆举行智联电动车全球产业基地建设发布会。重庆计划3年内建成智联电动车全球产业基地,到2027年实现年产1500万辆目标。雅迪科技作为行业代表参会,发布"紫精灵智能铅酸电池管理"等创新成果,并与重庆现代制造职业学院共建智能电动车及智慧能源研发中心。重庆摩托车产业基础雄厚,已形成完整产业链,此次发布会标志着重庆智联电动车产业正式迈入全球化发展新阶段。雅迪连续八年全球销量第一,其重庆基地已成为西南地区重要电动车生产基地。

  • 摩尔线程与松应科技共建国产物理AI仿真生态,开启机器人训练国产化新纪元

    在全球机器人产业研发效率持续升级的背景下,端到端物理AI仿真技术已成为缩短产品开发周期、降低试错成本的关键基础设施。叠加《"十四五"机器人产业发展规划》与《新一代人工智能发展规划》的政策推动,机器人产业正面临技术自主化与规模化应用的双重挑战。我们的愿景是为美好世界加速。

  • 聚焦“AI+运动康复”,iRest艾力斯特引领运动健康科学新纪元

    2025年3月21日,iRest艾力斯特在温州召开"AI+康复与产学研融合创新高峰论坛暨经销商大会"。大会聚焦"科技赋能健康"主题,汇聚全球顶尖专家探讨AI技术与运动康复的深度融合,发布多项创新成果与未来战略规划。公司通过AI技术构建智能康复体系,推出搭载多模态监测系统的高端产品,并与多所高校共建研发中心。近年来,艾力斯特持续深耕运动健康领域,签约�

  • 一文说透非农如何做?三大细节定方向!皇御环球3倍积分火热助攻

    黄金牛市大戏,迎来崭新剧情。这周五,美联储最看重的就业指标——非农就要公布,能否为畅旺金市再添薪火?当前金价稳稳突破3000,下一站看向哪里?劳动力市场兴衰最是关键!迎接超级行情,皇御环球特为投资者送上 3 倍积分,金银交易每满 1 手送 600 积分,并可换领惊喜赠金!图源:皇御环球一、交易非农,先看福利小贴士● 如何获取积分?参与最简单:不用繁琐登�

  • 高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

    全球首个工业界多模态推理模型Skywork-R1V升级至2.0版本,全面开源38B参数模型权重。该模型在高考物理、生物等学科题目上展现出强大的图文推理能力,准确率媲美985考生水平。技术突破包括:1)首创视觉奖励模型Skywork-VL Reward,在视觉和文本奖励基准测试中均获SOTA;2)引入混合偏好优化(MPO)机制,平衡推理深度与通用能力;3)采用选择性样本缓冲(SSB)技术解决训练中的优势�