首页 > 业界 > 关键词  > 正文

蚂蚁基础大模型已具备万卡AI集群,训练效率领先行业

2023-09-08 20:41 · 稿源:站长之家

站长之家(ChinaZ.com) 9月8日 消息:9月8日,在上海举办的外滩大会上,蚂蚁集团正式发布了金融大模型,并开源生成式AI编程平台CodeFuse。蚂蚁集团首席技术官、平台技术事业群总裁何征宇在接受采访时介绍,蚂蚁大模型走纯自研的技术路线,以全栈布局、长线发展为原则,以创造产业价值为目标。为此,蚂蚁坚决投入大模型底层基础设施,目前已建成万卡AI集群,训练效率领先行业,为大模型产业化应用提供有力支撑。

何征宇介绍,蚂蚁一直以来坚持核心技术自主创新,2022年底正式立项大模型研发,目前已形成从基础大模型到行业大模型以及产业应用的全栈布局。

今天发布的蚂蚁金融大模型基于蚂蚁基础大模型,针对金融产业深度定制。何征宇介绍,蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。

何征宇表示,未来蚂蚁将持续探索和精进大模型的五大能力方向。一是,建设高质量的数据标注团队,沉淀高质量数据体系;二是,攻坚基础大模型算法,以及高效绿色工程能力,提升模型逻辑推理等能力;三是,从通用语言大模型到通用多模态大模型,从一般通识走向全面专业;四是,建设高效的大模型评测标准和评测体系,加快大模型迭代速度;五是,建设大模型安全能力,保障大模型健康可持续发展。

在产业端,蚂蚁将结合自身能力优势和大模型技术特征,重点探索金融、民生、科技服务等领域的落地应用。

举报

  • 相关推荐
  • 万卡训练史上最大参数模型!百度文心大模型4.0最快下周见

    日前有媒体报道称,百度正加紧训练文心大模型4.0,已经接近可发布状态,这将是文心大模型3.5版本后,又一个重磅版本。文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。经过全面升级后,文心大模型4.0的训练速度、推理速度等将进一步提升,能否与GPT-4一战甚至超越后

  • 华为发布全新昇腾AI计算集群 支持超万亿参数大模型训练

    华为在全联接大会2023期间发布了全新架构的昇腾AI计算集群Atlas900SuperCluster,该集群可支持超万亿参数的大模型训练。该集群采用了全新的华为星河AI智算交换机CloudEngineXH16800,并使用了创新的超节点架构,大大提升了大模型训练能力。该集群还通过提升系统可靠性,将大模型训练的稳定性从天级提升到月级。

  • AI大模型时代 ≠ 只有大模型AI时代

    什么样的技术能经历时间洗礼还历久弥新?答案或许可以归总为一个“三部曲”般的规律——兴起、发展和大规模应用,外加这个过程再一次演进式的迭代。引领第一次工业革命的是蒸汽机,当它演进成为内燃机并开始普及时,第二次工业革命的颠覆者——电能本身以及与它相关的各种设备正处于初创期在电力设备走向微电子的迭代革新时,各种燃油引擎还在持续改良和普及中�

  • 领先的这些大模型,都被一家「收编」了

    GPT-4发布是一件足以载入AI史册的大事件。但随着时间的推移,人们也发现,即使是最先进的大模型也还没有强大到可以把所有的事情都做完。我们可以期待,生成式AI会在不远的未来颠覆更多行业。

  • 中兴通讯:将发布支持大模型训练的最新AI服务器

    10月11日,中兴通讯在互动平台上表示,作为国内主流的服务器厂商,其一直在积极应对人工智能领域的应用需求,并适时推出满足各类AI应用场景的服务器产品。采取了以下两个策略:首先,针对中小型模型的训练和推理需求,中兴通讯在今年1月推出了G5系列服务器。中兴通讯计划在今年内发布一款支持大模型训练的最新AI服务器。

  • 大模型数量全国领先的北京,昇腾AI“点燃”首个普惠算力底座

    大模型在抹平AI模型底层架构多样性的同时,也在悄然抹去城区之间的差异。站在北京石龙经济开发区20号院,很难将这里与京西地区百年钢铁史、千年采煤史联系起来。这里最关键的是时间,就跟农民种地一样,需要慢慢耕耘,自然生长。

  • 中国移动发布九天·众擎基座大模型 并推出多个行业大模型

    10月12日,中国移动推出了九天·众擎基座大模型,并基于该基座大模型发布了多个行业大模型,包括九天企业通话大模型、九天川流出行大模型等。中国移动还宣布了“天穹”算网大脑全网试商用。

  • 上海AI实验室开源工具箱XTuner 8GB显卡就可训练大模型

    上海人工智能实验室发布了一款面向大模型训练的开源工具箱XTuner,通过支持多种硬件适配,大幅降低了企业进行大模型训练的门槛,尤其是对中小企业具有重要意义。XTuner为各类开源模型提供了多样的微调框架XTuner支持与多款开源大模型的无缝衔接,可执行增量预训练、指令微调等任务类型。业内人士表示,这将推动我国在人工智能核心领域的技术进步。

  • 超13万个大模型!微软增强ChatGPT等开源模型训练、推理能力

    著名AI模型开源平台HuggingFace上有超过320,000个大模型,并且每天保持高速增长。据统计只有大约6,000个模型支持ONNX格式,但微软表示,实际上有超过130,000个模型支持该格式。在HuggingFace开源平台上还有10万个模型不支持ONNX格式,鼓励更多的技术研究机构、开源项目加入到ONNX社区,以通过ONNXRuntime增强开发效率。

  • 阿里通义行业大模型著作权获批

    天眼查App显示,近日,杭州阿里云飞天信息技术有限公司“通义行业大模型平台”软件著作权获登记批准,当前版本号为V1.0。杭州阿里云飞天信息技术有限公司成立于2019年3月,法定代表人为蒋江伟,注册资本100万人民币,由浙江阿里巴巴云计算有限公司全资持股。