大规模专家并行推理集群实现性能3倍跃迁，联通元景开启推理新纪元

2025-04-07 19:36 · 稿源：站长之家用户

近日，中国联通持续技术攻坚，依托元景大模型MaaS平台成功搭建“大规模专家并行” 推理集群，实现DeepSeek MoE 大模型在多节点间的超有效集群推理，单卡吞吐提升 3 倍，解码时延降低 50%。这一成果不仅为人工智能技术的创新发展提供了强大助力，也让各行业以更有效率应用 AI 技术，加速推动千行百业的数字化转型。

伴随大模型MoE结构重大技术革新，以往少量“全能型”专家的模式逐渐被取代，大量“专科型”小专家逐渐成为主流。这一转变，极大地提升了模型的针对性和精细化程度，使得模型效果显著改善。

推理应用在各行业的落地随之全面加速，市场对于推理服务的需求呈井喷式增长，Tokens 处理量的需求与日俱增，这对推理系统的性能提出了更高的要求。为应对这一挑战，大规模专家并行推理技术应运而生，为大模型推理的加速规模应用提供了强大的技术支撑。

联通元景大模型与昇腾深度合作，围绕大规模专家并行推理技术展开全方位创新，将 DeepSeek 671B满血版大模型的数百个“专科型” 小专家按特出方式分布到不同的NPU上，使得单卡权重占用显存降低 75%，权重加载耗时大幅减少，可用于数据计算的显存显著增加。

在通信环节，双方对集群跨机通信方案进行深度优化，通过引入先进计算与通信并行算法，整体通信效率提升40%。此外，双方联合创新多级负载均衡算法，准确识别并均衡各NPU 的负载，将卡间负载差异成功控制在 10% 以下，有效提升系统吞吐和计算资源利用率。

联通元景大模型MaaS平台结合大规模专家并行推理集群系统，基于DeepSeek 671B 满血版大模型持续进行针对性推理优化创新，打造高可靠、高性能、易运维推理服务。

围绕高可靠

依托实例内和实例间的多级容灾机制，保障业务连续性，提供长稳推理服务。围绕高性能，进行高并发请求调度、管理、转发等，打造整个集群的有效数据请求管理入口。

围绕易运维

进行集群内推理业务状态监控、以及PD身份和资源管理与决策等，打造整个推理集群的状态监控器和决策大脑，持续提升大规模专家并行推理集群易用性。

在数字经济蓬勃发展的浪潮中，中国联通始终勇立潮头，全面发力人工智能。从精心搭建智算基础设施，构建强大算力“引擎”，到成功落地大规模专家并行推理集群，打造高性能低时延推理“中枢”，联通元景大模型持续筑牢国产化智算底座，以技术需求双轮驱动，打造“普惠速成”的元景MaaS平台，让人工智能更简单，为 AI 产业发展注入强劲的“加速度”。

这一推理创新举措必将助力各行业在复杂多变、竞争激烈的市场环境中抢占先机，以智能化驱动数字化转型，进而推动实体经济高质量发展。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
餐饮数字化转型标杆：睿食拓数智方案，助力兰湘子380+门店高效运营管理

湘菜品牌兰湘子通过“小炒”“现炒现做”模式在正餐行业成功突围，六年扩张至380家门店。其高速发展依赖睿食拓提供的全链路数字化解决方案：前厅通过智能POS系统整合多渠道订单，小程序集成预点餐功能；后厨采用KDS系统实现无纸化操作与订单协同；总部借助数据驾驶舱实时监控全国门店运营。该方案精准破解效率、体验、管理三大核心难题，支撑品牌年均5000万用餐人次的高效运转，成为正餐业“数字化+烟火气”协同发展的标杆案例。

湘菜品牌兰湘子现炒现做

今日大家都在搜的词：

热文

3 天
7天

大规模专家并行推理集群实现性能3倍跃迁，联通元景开启推理新纪元

跨境支付的未来：人工智能、嵌入式金融和即时结算

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

人工智能巨头OpenAI拟上市估值或高达1万亿美元

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

餐饮数字化转型标杆：睿食拓数智方案，助力兰湘子380+门店高效运营管理

今日大家都在搜的词：

热文

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

荣耀500系列开启预约：Pro版外观首次亮相

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

苹果回应输入法宁死不屈：具备记忆功能与学习机制

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

焕新享界S9开卖72小时预订突破8000台

站长商机