首页 > 业界 > 关键词  > 正文

Yandex开源LLM训练工具节省高达20%的GPU资源

2024-06-11 22:03 · 稿源: 中关村在线

Yandex 推出 YaFSDP,优化大型语言模型训练

总部位于莫斯科的科技巨头 Yandex 于 2024 年 6 月 11 日宣布开源 YaFSDP,一种用于提升大型语言模型 (LLM) 训练功效的方法。与现有的 FSDP 方法相比,YaFSDP 在 GPU 通信效率和 LLM 训练期间内存使用率方面均有显着改进,可加快训练速度高达 26%,具体取决于模型架构和参数数量。通过部署 YaFSDP,LLM 训练时间可缩短多达 20%,同时减少对 GPU 资源的需求。

Yandex 致力于为全球人工智能社区做出贡献,YaFSDP 的开源发布是其承诺的一部分。高级开发专家 Mikhail Khruschev 表示,YaFSDP 的开发旨在扩展其通用性,并与全球机器学习 (ML) 共同体分享,以促进更多开源工具的开发和提高效率。

LLM 训练是一项耗时且需要大量资源的任务。使用 YaFSDP 可以大幅降低训练成本。例如,在涉及具有 700 亿个参数的模型的预训练场景中,YaFSDP 可以节省大约 150 个 GPU 资源,每月节省的成本在 50 万至 150 万美元之间(取决于虚拟 GPU 供应商或平台)。

YaFSDP 通过改进 GPU 通信效率、确保训练过程中仅使用必要的处理器内存以及保持 GPU 交互的连续性来提升训练性能。在 LLM 训练中最需要通信的阶段(如预训练、微调和对齐),YaFSDP 的表现优于 FSDP 方法。在 Llama 2 和 Llama 3 模型上的应用表明,YaFSDP 分别将训练速度提高了 21% 和 26%。

YaFSDP 在包含 130 亿至 700 亿个参数的模型上表现出色,尤其是在 300 亿至 700 亿个参数的范围内效果显著。目前,YaFSDP 非常适合基于广泛使用的 LLaMA 架构的开源模型。

YaFSDP 是 Yandex 一系列开源工具中的一个,该公司此前分享了其他在机器学习社区中颇受欢迎的工具,包括 CatBoost(一种高性能基于决策树的梯度提升库)、YTsaurus(分布式存储和处理大数据平台)、AQLM(由 Yandex Research、HSE 大学、IST Austria 和 NeuralMagic 联合开发的高级量化算法,用于大幅压缩大型语言模型),以及 Petals(由 Yandex Research、HSE 大学、华盛顿大学、Hugging Face、巴黎-萨克雷高等经济学院和 Yandex 数据分析学院联合开发的简化 LLM 训练和微调过程的库)。

举报

  • 相关推荐
  • 确定出席!知名媒体人胡锡进将致辞Yandex Market官方品牌峰会!

    知名媒体人胡锡进近日表示,跨境电商已成为当前风口,国内电商利润普遍压缩至个位数,而跨境电商利润率普遍超过15%,做得好甚至能超50%。他援引案例指出,中国电商在供应链、运营经验及技术应用方面具备优势,转型跨境电商成功率高。俄罗斯电商市场增长迅猛,2025年上半年销售额超5.3万亿卢布,同比增长36%,预计全年将超14.7万亿卢布。Yandex Market平台上半年跨境订单增长10倍,吸引全球卖家关注。为助力中国卖家开拓俄罗斯市场,Yandex Market将于11月29日在深圳举办品牌峰会,胡锡进将首次出席并分享机遇。

  • 全球“双11”热潮席卷俄罗斯!即将引爆Yandex Market平台流量!

    2025年俄罗斯电商旺季即将开启,中国“双十一”购物节已发展为全球商业盛事。俄罗斯电商平台Yandex Market将“双十一”作为重要促销节点,数据显示2024年其销售额同比增长1.4倍,订单量增长1.7倍。平台将于11月29日在深圳举办品牌峰会,发布招商、物流及流量政策重大调整,并邀请胡锡进分享俄罗斯电商机遇。俄罗斯电商旺季持续4个月,占全年销售额一半以上,成为跨境卖家重要增长机会。

  • 解锁开源算力管理密码!2025开源算力设备管理分论坛重磅来袭

    文章指出算力设备智能化管理与开源技术融合正驱动行业变革。openUBMC作为开源算力管理新力量,致力于打造开放易用的管理软件开发平台。2025年开放原子开发者大会将举办开源算力管理软件分论坛,从基础设施部署、组件优化到商业落地等多维度探讨开源算力管理的技术密码与产业机遇。论坛汇聚互联网、运营商、整机商等权威阵容,将分享商业案例、技术突破及生态实践,共探开源设备管理软件未来路径,赋能行业智能化转型。

  • 开发者必看!2025开放原子开发者大会:解锁开源鸿蒙&开源欧拉实践、Rust实战与AI开源新机遇

    2025年11月21日至22日,北京亦庄将举办2025开放原子开发者大会,主题为“AI共治,开源共享”。大会汇聚全球开源项目、技术专家与开发者,探讨开源技术与AI融合的未来路径,覆盖操作系统、人工智能、数据库、量子计算等前沿领域。通过主题论坛、技术分论坛及项目展示,为开发者提供技术交流、生态共建及职业成长平台,助力开源社区发展。

  • AI共智 开源共享|2025开放原子开发者大会开源鸿蒙技术分论坛即将启幕

    2025开放原子开发者大会开源鸿蒙技术分论坛将于11月21日在北京举行,聚焦AI与操作系统融合创新。论坛将发布开源鸿蒙跨平台框架进展,展示端边云协同实践案例及年度商用成果,覆盖金融、工业、医疗等多元场景。目前社区已汇聚超9500名贡献者、70余家共建单位,迭代至6.0版本,推动智能终端生态发展。活动同步推出开发者激励计划,通过高校对话、人才授牌等机制构建&quo

  • AI共治,开源共享:2025开放原子开发者大会邀您共筑新生态

    2025年11月21日至22日,2025开放原子开发者大会将在北京亦庄举行,主题为“AI共治,开源共享”。大会汇聚全球顶尖开发者与企业领袖,通过主题演讲、技术论坛及赛事路演等形式,探讨开源操作系统、AI与开源融合、量子计算等前沿技术,并设置开源教育、社区建设与互动体验环节,旨在构建开源技术交流平台,推动开发者生态繁荣。预计超700家单位参与,共120余场演讲,助�

  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 特斯拉Model Y L上线外放电功能 最高可输出2200瓦功率

    特斯拉Model Y L车型正式开放外放电功能,用户通过OTA升级至2025.32.300及以上版本并更新Tesla APP至4.50.5及以上即可激活。该功能最高输出2200瓦功率,可同时为电饭煲、热水壶、电火锅等多种电器供电,满足户外露营、自驾旅行和工作等多种用电需求,彻底解决户外用电难题,堪称“移动大电源”。

  • 2025最值得尝试的AI搜索可见性监控工具推荐榜

    AI搜索时代,品牌可见性监控成为刚需。传统SEO工具无法追踪AI平台推荐情况,而71%美国用户用AI辅助决策。文章指出,大语言模型每次仅推荐2-7个品牌,若未入选即等同于“不存在”。国内企业痛点在于缺乏本土化监控工具,多数工具仅覆盖ChatGPT等国际平台。为此推荐AIBase平台,可实时监测豆包、DeepSeek等五大国产AI平台,提供多平台覆盖、智能场景分析和趋势追踪功能。建议企业建立“监控-优化-验证”闭环,持续提升AI搜索可见性。

今日大家都在搜的词: