蚂蚁集团发布两款创新 MoE 大模型，训练成本大幅降低

2025-03-24 15:28 · 来源： AIbase基地

近日，蚂蚁集团的 Ling 团队在预印版 Arxiv 平台上发布了题为《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展3000亿参数混合专家 LING 大模型》的技术论文，介绍了他们研发的两款新型大语言模型:百灵轻量版（Ling-Lite）和百灵增强版(Ling-Plus)。这两款模型在设计上采用了多项创新，能够在低性能硬件上高效训练，显著降低了成本。

百灵轻量版的参数规模为168亿，其中激活参数为27.5亿。而增强版的基座模型则拥有高达2900亿的参数，激活参数为288亿。这两款模型的性能均达到行业领先水平，尤其是增强版，其3000亿参数的 MoE 模型在使用国产 GPU 的低性能设备上进行训练时，表现与高端英伟达芯片的模型相当。

加速器，提速，光

图源备注：图片由AI生成，图片授权服务商Midjourney

通常，MoE 模型的训练需要依赖昂贵的高性能 GPU，如英伟达的 H100和 H800，这不仅成本高昂，还受到芯片短缺的限制，从而影响了其在资源有限环境中的应用。为此，蚂蚁集团 Ling 团队提出了一个全新的目标 ——“不使用高级 GPU” 扩展模型，突破了资源和预算的限制。他们的创新训练策略包括动态参数分配、混合精度调度、以及升级的训练异常处理机制，这些策略有效地缩短了中断响应时间，并且优化了模型评估流程，压缩了验证周期超过50%。

在实验中，Ling 团队对9万亿个 token 进行了 Ling-Plus 的预训练。结果显示，使用高性能硬件配置训练1万亿 token 的成本约为635万元人民币，而采用蚂蚁的优化方法后，低规格硬件训练成本降至508万元左右，节省了近20%。同时，性能与阿里通义 Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat 相当。

这一技术成果若能得到广泛应用，将为国产大模型提供更加经济高效的解决方案，减少对英伟达芯片的依赖，为未来的人工智能发展开辟新道路。

相关推荐

李斌：蔚来品牌明年会推出两款大型SUV 分别为ES9和ES7

蔚来汽车今日公布了二季度财报。蔚来公司二季度交付72,056台，同比增长25.6%，环比增长71.2%。二季度营收190.1亿元，同比增长9.0%，环比增长57.9%。在财报后的电话会议上，李斌表示，蔚来品牌明年会推出两款大SUV，一款是ES9，一款是大五座 SUV ES7。加上乐道L80，公司明年会有三款新的大SUV车型交付。今年不会有新的产品发布，原本计划发布乐道L80，因为产能问题，改到明年

蔚来财报二季度交付营收增长
如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

文章探讨了AI模型调用成本管理的痛点，包括GPT-4等模型复杂的计费规则（如Token分级、上下文溢价、多模态叠加收费）导致实际成本常超预算40%。提出AIbase计算器三步解决方案：自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性，强调数据溯源、用量预警和预算缓冲功能，帮助开发者实现精准成本控制，告别手动制表与定�

AI模型成本 GPT-4定价 Claude3降价
降低创作门槛！爱诗科技新一代生成式大模型加速AI视频大众化

爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5，实现秒级高质量视频生成，支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升，覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手，降低使用门槛，用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用，加速行业落地。

AI视频生成 PixVerse V5
将AI大模型费用计算器作为战略工具：企业如何规避AI项目的成本陷阱

AI项目规模化应用面临不可预测的运营成本挑战，尤其是大模型API调用费用难以精准预测，导致项目ROI计算失效。成本失控源于计费维度复杂、价格变动频繁及用户行为影响。领先企业通过成本管控前移，在项目可行性分析阶段引入AIbase等成本计算工具，实现成本可视化，支持技术选型和预算建模，从被动应对转向主动管理，提升AI应用的经济性和可持续竞争力。

数字化转型人工智能运营成本
荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域热点内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出开源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

AI 语音大模型 Step-Audio2mini
美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

也有线上体验地址:https://longcat.ai 我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。我直接录了个屏给大家看一下。这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，他俩都是MoE架构，而且总参数量差不太多。为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰�
AI应用太烧钱？我们用一款精准的AI大模型费用计算器做出了清晰预算

初创团队“智询未来”在开发AI问答应用时面临核心模型选择困境：GPT-4-turbo能力强但价高，Claude-3长文本处理优，Llama-3成本低但性能稍弱。通过AIbase成本计算器精准测算，发现Claude-3-Sonnet性价比最优，每月可省近4000元，还能通过优化提示词进一步降本15%。数据驱动的决策让团队将节省预算投入数据安全和提示词优化，凸显成本测算对初创企业技术选型的重要性。
昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

中国科学技术大学张燕咏团队在昇腾算力支持下，成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略，有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题，显著提升推理性能。实验显示，该方案在多项指标上较主流方案提升超30%，为昇腾技术优化MoE模型推理提供了宝贵借鉴，将加速其在各领域的落地应用。

人工智能大模型 MoE稀疏大模型
武大、蚂蚁集团发布新一代遥感大模型：12边型战士

近日，武汉大学与蚂蚁集团联合发布了新一代语义增强遥感大模型SkySense，堪称12边型战士。其相关研究成果在国际知名学术期刊《自然机器智能》上在线发表。当前，遥感基础大模型在复杂动态地球观测场景应用中面临挑战，如多模态遥感影像数据融合性能欠佳、下游任务微调依赖大量数据、对遥感语义信息挖掘不足等。为攻克这些难题，研究团队基于前期多模态遥感大�

遥感大模型语义增强多模态融合
荐最高提效8倍！腾讯游戏发布专业游戏AI大模型，美术师做动画不用辣么“肝”了

在最近与科隆国际游戏展同期举办的Devcom开发者大会上，AI再次赚足了脸面。微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题，“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。近年来，游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

AI 游戏美术生产效率

今日大家都在搜的词：

热文

3 天
7天

蚂蚁集团发布两款创新 MoE 大模型，训练成本大幅降低

李斌：蔚来品牌明年会推出两款大型SUV 分别为ES9和ES7

如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

降低创作门槛！爱诗科技新一代生成式大模型加速AI视频大众化

将AI大模型费用计算器作为战略工具：企业如何规避AI项目的成本陷阱

荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

AI应用太烧钱？我们用一款精准的AI大模型费用计算器做出了清晰预算

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

武大、蚂蚁集团发布新一代遥感大模型：12边型战士

荐最高提效8倍！腾讯游戏发布专业游戏AI大模型，美术师做动画不用辣么“肝”了

今日大家都在搜的词：

热文

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

《亮剑》开播20周年：今日全弹幕重返B站

AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台

蜜雪冰城上半年净赚27亿：全球门店破5.3万家加速全球化布局

小米澎湃OS 3超级岛适配应用公布加速推进多场景适配

三大运营商回应是否支持eSIM版iPhone：需等待通知

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

抖音升级AI内容标识功能上线两项核心功能

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

站长商机