首页 > 业界 > 关键词  > 阿里最新资讯  > 正文

512颗GPU、10万亿参数!阿里达摩院发布全球AI预训练模型

2021-11-08 20:20 · 稿源: 快科技

11月8日,阿里巴巴达摩院公布了多模态大模型M6”的最新进展,其参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型。

作为通用性AI大模型,M6拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。

与传统AI相比,大模型拥有成百上千倍神经元”数量,认知和创造能力也更胜一筹,被普遍认为是未来的基础模型”。

但是,大模型的算力成本相当高昂,比如训练1750亿参数语言大模型GPT-3所需能耗,能让一辆汽车在地月之间往返一趟。

今年5月,通过专家并行策略及优化技术,达摩院M6团队将万亿模型能耗降低超过80%,效率提升近11倍。

10月,M6再次突破业界极限,使用512颗GPU,在10天内就训练出了具有可用水平的10万亿模型,相比去年发布的大模型GPT-3,M6实现了同等参数规模,能耗却只有1%。

另一方面,AI大模型扩展到千亿及以上参数的超大规模时,很难放在一台机器上,为此达摩院阿里云PAI自研Whale框架上搭建了MoE模型,并通过更细粒度的CPU offload技术,最终实现将10万亿参数放进512张GPU:

自研Whale框架:

自研Whale分布式深度学习训练框架,针对数据并行、模型并行、流水并行、混合并行等多种并行模型进行了统一架构设计,让用户在仅仅添加几行API调用的情况下就可以实现丰富的分布式并行策略。

MoE专家并行策略:

在Whale架构中实现Mixture-of-Experts(MoE)专家并行策略,在扩展模型容量、提升模型效果的基础上,不显著增加运算FLOPs(每秒所执行的浮点运算次数),从而实现高效训练大规模模型的目的。

CPU offload创新技术:

在自研的分布式框架Whale中通过更细粒度的CPU offload,解决了有限资源放下极限规模的难题,并通过灵活地选择offload的模型层,进一步地提高GPU利用率。

此外,针对训练效率问题,M6团队设计了Pseudo-to-Real(共享解除)机制,即利用训练好的共享参数模型初始化大模型,让收敛效率进一步提升7倍,解决大模型训练速度慢的问题。

对比不使用该机制,预训练达到同样loss用时仅需6%;和此前万亿模型相比,训练样本量仅需40%。

作为国内首个商业化落地的多模态大模型,M6已在超40个场景中应用,日调用量上亿。

今年,大模型首次支持双11,应用包括但不限于:

- M6在犀牛智造为品牌设计的服饰已在淘宝上线;

- 凭借流畅的写作能力,M6正为天猫虚拟主播创作剧本;

- 依靠多模态理解能力,M6正在增进淘宝、支付宝等平台的搜索及内容认知精度。

未来,M6将积极探索与科学应用的结合,通过AI for science让大模型的潜力充分发挥,并加强M6与国产芯片的软硬一体化研究。

目前,达摩院联合阿里云已推出M6服务化平台,为大模型训练及应用提供完备工具,首次让大模型实现开箱即用”,算法人员及普通用户均可方便地使用平台。

举报

  • 相关推荐
  • 阿里云AI火花大会:规模化前夜,AI务实派靠场景破局

    阿里云在深圳成功举办AI创新应用大会,提出要将"云+AI"技术转化为千行百业的商业动能。大会吸引了近千家企业参与,探讨AI技术从理论走向商业实践的路径。阿里云智能集团副总裁刘湘雯指出,AI不仅是技术演进,更是生产力革命。会议聚焦大模型与AI Agent的融合机遇,提出企业智能化转型需把握四大趋势:技术迭代加速、开源填补鸿沟、智能体从"工具人"变为"决策者"、交互革命重构人机触点。阿里云通过三层落地逻辑(模型API Server、Agent对接层、行业解决方案)助力企业穿透技术迷雾,并发布AI应用先锋计划,联合生态伙伴加速AI应用从概念验证到规模化落地。

  • 阿里云百炼平台首个停车MCP服务上线,捷停车提供全维数据和场景支持

    8月初,捷停车-停车信息MCP服务正式上线阿里云百炼平台,成为该平台首个停车行业MCP服务,为开发者和用户提供高效停车信息查询能力。该服务覆盖全国400城、超5.9万停车场,注册用户突破1.4亿,支持车位查询、快速进出场及便捷缴费等全流程智慧停车体验。通过MCP服务,捷停车打破停车数据“信息孤岛”,实现专业停车能力“开箱即用”,助力出行服务体验升级,并推动停车行业与AI技术深度融合,加速智慧经济落地。

  • 真补贴、真落地!阿里云发布AI应用先锋计划,助力企业跑通AI第一程

    阿里云AI应用先锋计划通过“云+AI+行业适配”模式,助力企业突破AI落地瓶颈。该计划提供云资源补贴、POC服务、专家咨询及联合品牌推广等支持,降低企业AI应用门槛。结合端云协同架构,解决算力成本高、模型部署难等问题,已在智能硬件、教育、政务等领域实现案例落地,推动AI从技术尝鲜走向常态化应用。

  • 您的“鳄了么”订单需到场自提:活鳄鱼上架阿里拍卖 需自行抓捕

    前几日,一只狸花猫因主人无力偿还债务,被纳入司法拍卖行列。这只狸花猫凭借“抵债”的特殊身份以及呆萌可爱的外形,迅速在网络上走红,成为网友们热议的焦点,不少人对这只“命运坎坷”又惹人喜爱的小猫咪表现出了浓厚兴趣。 无独有偶,近日中山市第二人民法院在阿里拍卖平台上又公开拍卖一批特殊拍品——活鳄鱼,拍卖价格定为16.8万元。这一消息一经发布,�

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • 阿里云助力集思科技升级电商直播数字人——拓展AI直播市场边界,剑指万亿销售市场 | 看见新力量NO.144

    AI技术正加速渗透电商直播领域,奢侈品牌Burberry通过数字人主播实现618期间成交额同比增长超500%。集思科技推出的"实时替身"金牌主播2.0产品,突破非标品直播边界,实现视觉自然化+沟通智能化+内容协同化。阿里云通义千问3大模型为数字人提供精准语料支持,无影云电脑保障24小时稳定直播。未来AI销售将向"人货场"重构方向发展,数字人不仅能实现7×24小时直播,更将向一对一精准销售升级,打造万亿级市场新机遇。

  • 阿里Wan2.2-S2V正式发布:一张图+一段音频 即可生成人物动态视频

    今晚,阿里云正式发布全新多模态视频生成模型通义万相Wan2.2-S2V,并宣布开源。 Wan2.2-S2V极大地简化了视频制作过程,仅需提供一张静态图片和一段音频,模型便能生成面部表情自然、口型与音频高度一致、肢体动作流畅丝滑的电影级数字人视频。 支持分钟级长视频稳定生成,不止嘴动,手势、表情、姿态都能动。

  • 阿里小号宣布暂缓停服:可继续正常使用

    今日,阿里通信面向广大用户发布了一则重要公告,此前引发关注的阿里小号业务调整出现新变化,宣布暂缓停服,用户权益得到进一步保障。 早在2025年7月29日,阿里通信曾发布阿里小号业务调整公告,这一消息犹如一颗石子投入平静湖面,在用户群体中激起千层浪,大家纷纷就服务停用后可能面临的问题进行反馈与咨询。阿里通信对此高度重视,自公告发布后,便持续积�

  • AI日报:钉钉十周年发布8.0版本;微信悄悄上线AI播客;阿里开源 Mobile-Agent 3

    AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。

  • 先后打通苹果、微软!小米澎湃OS 3互联服务Windows通用版开启内测

    小米在昨天的发布会上介绍了不少澎湃OS 3与苹果的互联功能,包括小米手机和iPhone、iPad、Mac都能进行互联互通。 值得注意的是,小米这次不光打通了苹果生态,还覆盖了范围更大的Windows系统。 小米刚刚宣布,小米互联服务Windows通用版(Beta)今日开启内测,升级了澎湃OS 3 Beta版的机型可以尝鲜体验。

今日大家都在搜的词: