首页 > 传媒 > 关键词  > 中国联通最新资讯  > 正文

大规模专家并行推理集群实现性能3倍跃迁,联通元景开启推理新纪元

2025-04-07 19:36 · 稿源: 站长之家用户

近日,中国联通持续技术攻坚,依托元景大模型MaaS平台成功搭建“大规模专家并行” 推理集群,实现DeepSeek MoE 大模型在多节点间的超有效集群推理,单卡吞吐提升 3 倍,解码时延降低 50%。这一成果不仅为人工智能技术的创新发展提供了强大助力,也让各行业以更有效率应用 AI 技术,加速推动千行百业的数字化转型

伴随大模型MoE结构重大技术革新,以往少量“全能型”专家的模式逐渐被取代,大量“专科型”小专家逐渐成为主流。这一转变,极大地提升了模型的针对性和精细化程度,使得模型效果显著改善。

推理应用在各行业的落地随之全面加速,市场对于推理服务的需求呈井喷式增长,Tokens 处理量的需求与日俱增,这对推理系统的性能提出了更高的要求。为应对这一挑战,大规模专家并行推理技术应运而生,为大模型推理的加速规模应用提供了强大的技术支撑。

联通元景大模型与昇腾深度合作,围绕大规模专家并行推理技术展开全方位创新,将 DeepSeek 671B满血版大模型的数百个“专科型” 小专家按特出方式分布到不同的NPU上,使得单卡权重占用显存降低 75%,权重加载耗时大幅减少,可用于数据计算的显存显著增加。

在通信环节,双方对集群跨机通信方案进行深度优化,通过引入先进计算与通信并行算法,整体通信效率提升40%。此外,双方联合创新多级负载均衡算法,准确识别并均衡各NPU 的负载,将卡间负载差异成功控制在 10% 以下,有效提升系统吞吐和计算资源利用率。

联通元景大模型MaaS平台结合大规模专家并行推理集群系统,基于DeepSeek 671B 满血版大模型持续进行针对性推理优化创新,打造高可靠、高性能、易运维推理服务。

围绕高可靠

依托实例内和实例间的多级容灾机制,保障业务连续性,提供长稳推理服务。围绕高性能,进行高并发请求调度、管理、转发等,打造整个集群的有效数据请求管理入口。

围绕易运维

进行集群内推理业务状态监控、以及PD身份和资源管理与决策等,打造整个推理集群的状态监控器和决策大脑,持续提升大规模专家并行推理集群易用性。

在数字经济蓬勃发展的浪潮中,中国联通始终勇立潮头,全面发力人工智能。从精心搭建智算基础设施,构建强大算力“引擎”,到成功落地大规模专家并行推理集群,打造高性能低时延推理“中枢”,联通元景大模型持续筑牢国产化智算底座,以技术需求双轮驱动,打造“普惠速成”的元景MaaS平台,让人工智能更简单,为 AI 产业发展注入强劲的“加速度”。

这一推理创新举措必将助力各行业在复杂多变、竞争激烈的市场环境中抢占先机,以智能化驱动数字化转型,进而推动实体经济高质量发展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • LIFETOO品牌麦角硫因:开启抗衰养颜新纪元

    LIFETOO是一个专注于抗衰老营养健康的品牌,由多位生物学博士创立,依托美日先进营养科学技术研发产品。其明星产品麦角硫因胶囊具有强效抗氧化功效,能改善皮肤状态、增强弹性。品牌拥有专业研发团队和自有生产线,产品通过严格质量控制,在全球多个国家销售并获得消费者认可。LIFETOO坚持"探索营养与健康的未来"理念,致力于为消费者提供高品质、个性化的营养呵护方案。

  • 行业先行者,艾娑姟雅(EXOGAIA)开启抗衰护肤新纪元

    艾娆婵雅(EXOGAIA)在美博会上展示前沿细胞科研成果,推出"双外泌体"护肤理念。品牌采用TFF外泌体提取技术,从羊胎盘和莲叶中提取高活性物质,通过膜融合机制促进胶原再生。其产品线涵盖抗衰修护全系列,包括微囊精华液、人参精华油等明星单品。依托广东慈惠生物科技强大的科研团队,品牌专注于肌衰老机理研究,已获得国际INCI认证。艾娆婵雅通过创新技术重新�

  • 英氏携手中国营养学会开启科学喂养新纪元

    4月18日,中国营养学会与英氏控股集团在浏阳经开区共同举办"婴幼儿辅食科学5阶喂养标准体系化建设暨深度科研启动仪式"。活动聚焦婴幼儿辅食行业标准化发展,推出"科学5阶精准喂养体系",针对不同发育阶段婴幼儿营养需求进行精准划分。英氏与江南大学、湖南省农科院签署战略协议,共建"婴童未来食品实验室"和"婴幼儿辅食与营养产业发展研究院",推动产学研深度融合。英氏投资建设的婴幼儿营养与健康科学产业基地一期已在浏阳建成投产,致力于全生命周期营养产品研发。专家指出,科学喂养直接影响婴幼儿成长发育,行业标准实施将规范市场秩序,提升国民婴幼儿营养健康水平。

  • Funcom宣布《沙丘:觉醒》大规模测试即将开启

    《沙丘:觉醒》将于6月10日正式上线,5月10日将在伦敦与PAX East同步举行全球在线派对直播,并发放数万测试密钥。5月9日至12日将开启大规模测试,玩家可体验前20小时内容及第一章剧情。游戏基于弗兰克·赫伯特经典科幻小说改编,融合电影化叙事与开放世界生存玩法,玩家将探索厄拉科斯沙漠星球,揭开神秘预言与古老阴谋交织的故事。购买豪华版或终极版可提前5天进入游戏。开发商Funcom曾推出《流放者柯南》等知名作品。

  • 妙音数科领航 VR 创新 ,《一念幻世》开启沉浸式科技新纪元

    北京妙音数科推出国内首个"AI觉醒与人类文明存续"主题VR大空间沉浸项目《一念幻世》。该项目融合AI与VR技术,采用厘米级精准追踪系统,支持玩家在数百平米真实场地自由探索虚拟场景。创新性地结合AI智能实时语音对话与手势识别技术,实现"所见即所感"的沉浸体验。项目以AI觉醒危机为主线,通过交互式解谜引导玩家思考科技伦理问题。首发落地河北邯郸�

  • 超聚变探索者大会2025:算力焕新,开启智能新纪元

    4 月 15 日- 17 日,以“共建智能体时代”为主题的超聚变探索者大会 2025 在郑州成功举行。大会汇聚 2500 余名行业领袖、专家、媒体等伙伴及客户,提出并深入探讨智能体时代的发展趋势、驱动要素与价值应用,重磅发布超聚变算力业务、城企数智业务、智慧能源解决方案三大业务领域的全新产品矩阵,共同聚焦技术创新的广阔应用,与全球生态伙伴积极拥抱战略机遇,携手共

  • 不要思考过程,推理模型能力能够更强

    UC伯克利和艾伦实验室的最新研究表明,推理模型无需依赖冗长的思考过程也能有效工作。研究人员提出的"无思考(NoThinking)"方法通过简单提示直接生成解决方案,跳过了传统推理模型中的显性思考步骤。实验证明,在低资源(低token数量、少模型参数)或低延迟情况下,NoThinking方法的表现优于传统思考方式,能减少token使用量并提高推理速度。该方法在数学问题解决、编程和形式定理证明等任务中表现优异,尤其在资源受限时优势更明显。研究还发现,结合并行计算扩展后,NoThinking能进一步提升性能,在保持准确性的同时显著降低延迟和计算成本。这一发现挑战了"推理模型必须依赖详细思考过程"的传统认知。

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。

  • 猿辅导开启“教育+AI”新纪元,小猿AI三大产品重塑学习全场景体验

    4月15日,猿辅导集团发布教育行业首个AI范式"小猿AI",推出覆盖家校场景的三大战略级产品。该AI系统基于十年教育数据沉淀,构建四层技术架构:动态学情数据库、自研大模型矩阵和个性化学习方案。核心产品包括:1)小猿AI App,首创"五重错因分析系统",学习效率提升40%;2)小猿AI学习机,搭载13英寸护眼屏和智能基座;3)飞象人工智能通识课,国内首套K12全学段AI课程。创新亮点包括知识导航系统精准度达91%、情感计算引擎识别8类情绪状态。集团宣布实施普惠计划,基础功能向全国中小学生免费开放。此次发布标志着我国教育智能化进入新阶段,通过"技术+内容+终端"立体化布局,重新定义因材施教内涵。

  • 生成很强,推理很弱:GPT-4o的视觉短板

    研究显示,GPT-4o在图像理解和推理上表现出色,能生成精美图片,但在基础逻辑测试中表现欠佳,暴露出理解、推断及多步骤逻辑处理的不足。例如,被要求画一只猫时,它先画了狗然后改为猫,但仍存在错误判断。这表明当前AI更像“精确指令机器”,需进一步优化以实现更精细的图像理解和复杂任务处理。