首页 > 业界 > 关键词  > 正文

Yandex开源LLM训练工具节省高达20%的GPU资源

2024-06-11 22:03 · 稿源: 中关村在线

Yandex 推出 YaFSDP,优化大型语言模型训练

总部位于莫斯科的科技巨头 Yandex 于 2024 年 6 月 11 日宣布开源 YaFSDP,一种用于提升大型语言模型 (LLM) 训练功效的方法。与现有的 FSDP 方法相比,YaFSDP 在 GPU 通信效率和 LLM 训练期间内存使用率方面均有显着改进,可加快训练速度高达 26%,具体取决于模型架构和参数数量。通过部署 YaFSDP,LLM 训练时间可缩短多达 20%,同时减少对 GPU 资源的需求。

Yandex 致力于为全球人工智能社区做出贡献,YaFSDP 的开源发布是其承诺的一部分。高级开发专家 Mikhail Khruschev 表示,YaFSDP 的开发旨在扩展其通用性,并与全球机器学习 (ML) 共同体分享,以促进更多开源工具的开发和提高效率。

LLM 训练是一项耗时且需要大量资源的任务。使用 YaFSDP 可以大幅降低训练成本。例如,在涉及具有 700 亿个参数的模型的预训练场景中,YaFSDP 可以节省大约 150 个 GPU 资源,每月节省的成本在 50 万至 150 万美元之间(取决于虚拟 GPU 供应商或平台)。

YaFSDP 通过改进 GPU 通信效率、确保训练过程中仅使用必要的处理器内存以及保持 GPU 交互的连续性来提升训练性能。在 LLM 训练中最需要通信的阶段(如预训练、微调和对齐),YaFSDP 的表现优于 FSDP 方法。在 Llama 2 和 Llama 3 模型上的应用表明,YaFSDP 分别将训练速度提高了 21% 和 26%。

YaFSDP 在包含 130 亿至 700 亿个参数的模型上表现出色,尤其是在 300 亿至 700 亿个参数的范围内效果显著。目前,YaFSDP 非常适合基于广泛使用的 LLaMA 架构的开源模型。

YaFSDP 是 Yandex 一系列开源工具中的一个,该公司此前分享了其他在机器学习社区中颇受欢迎的工具,包括 CatBoost(一种高性能基于决策树的梯度提升库)、YTsaurus(分布式存储和处理大数据平台)、AQLM(由 Yandex Research、HSE 大学、IST Austria 和 NeuralMagic 联合开发的高级量化算法,用于大幅压缩大型语言模型),以及 Petals(由 Yandex Research、HSE 大学、华盛顿大学、Hugging Face、巴黎-萨克雷高等经济学院和 Yandex 数据分析学院联合开发的简化 LLM 训练和微调过程的库)。

举报

  • 相关推荐
  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • 海拔高达4500米!世界最高海拔光热电站西藏投产

    快科技5月18日消息,据媒体报道,中国电建EPC总承包的西藏扎布耶源网荷储一体化综合能源项目近日全面投产,这座海拔4500米的光热电站创造了全球同类项目的海拔最高纪录。这一重大突破标志着我国在高海拔地区光热技术应用取得实质性进展。该项目位于西藏日喀则市仲巴县,是全球首个在高海拔电网末端地区采用槽式光热电站作为主电源的清洁能源孤网系统,被业内誉为清洁能源领域的珠穆朗玛峰。项目集成了40兆瓦槽式光热电站、35兆瓦光伏电站和20兆瓦/40兆瓦时电储能设施,完美契合我国十四五新能源发展规划要求。面对4500米超高海拔的极端环?

  • 巴黎世家半身裙被吐槽像平角短裤 售价高达4500元

    ​近日,奢侈品牌巴黎世家推出的一款女款半身裙在时尚圈和消费者群体中引发了广泛热议。不少网友在看到该裙子后纷纷吐槽,称其造型与平角短裤极为相似,直呼“看不懂时尚”。 据巴黎世家官网介绍,这款女士深蓝色弹力平纹针织半身裙亮相于2025秋季系列Look50和Look54。裙子采用弹力棉混纺平纹针织面料,设计为平角短裤造型的迷你半身裙,剪裁裆部,中腰设计,弹性�

  • 国际权威眼科杂志《Ophthalmology》发布明月轻松控镜片临床研究:减缓近视加深有效率高达73.82%

    国际顶尖眼科期刊《Ophthalmology》发表研究证实,明月镜片青少年近视管理镜片"轻松控"采用非对称多点离焦设计(AMDT),一年临床试验显示其近视控制有效率达73.82%,显著优于对照组。该镜片创新性地平衡了防控效果与视觉舒适度,采用1329个微透镜增加离焦信号,并基于中国青少年用眼特征优化光学区设计。研究由中山眼科中心杨晓教授团队与天津眼科医院合作完成,采用多中心随机对照试验,证实该技术在延缓近视进展同时不影响视觉质量,为近视防控提供了新选择。

  • 开源共建智启未来 开源鸿蒙开发者大会2025成功举办

    5月24日,开源鸿蒙开发者大会2025在深圳隆重开幕。大会发布了开源鸿蒙5.1版本,并启动了应用技术组件共建和AI+Agent技术共建等重要项目。会议设立八大主题论坛,邀请行业专家和开发者共同探讨技术发展。深圳市政府表示将持续支持开源鸿蒙生态建设。开放原子开源基金会理事长程晓明指出,开源鸿蒙已成为发展最快的开源操作系统之一,代码规模达1.3亿行,覆盖金融、交通等多个领域。大会还展示了基于开源鸿蒙的创新产品,包括智能手表、笔记本等设备,并举办了第二届中国研究生操作系统开源创新大赛启动仪式。未来开源鸿蒙将持续推进全球化生态布局,构建万物互联新生态。

  • 开源鸿蒙开发者大会2025成功召开,启动开源鸿蒙应用技术组件共建

    截至目前,开源鸿蒙已累计发布 8 个大版本,共建共享 15 个技术域的 1115 款开源三方库和 6 个跨平台框架,加速应用和设备的开发。

  • KANZI开源鸿蒙版闪耀亮相开源鸿蒙开发者大会2025

    5月24日,开源鸿蒙开发者大会2025在深圳隆重开幕。大会发布了开源鸿蒙5.1版本,并启动了开源鸿蒙应用技术组件共建、AI Agent技术共建等重要项目。OSWare奥思维携Kanzi开源鸿蒙版亮相,展示了基于OpenHarmony系统的3D HMI解决方案,其核心优势包括:1)高效开发与逼真渲染效果,支持60FPS流畅运行;2)一次开发多端部署,兼容分布式能力;3)通过工程模板和所见即所得设计模式,可缩短50%以上开发周期。Kanzi作为汽车行业HMI开发工具链,已成功适配开源鸿蒙系统,填补了高端HMI开发工具空白,助力车企应对技术挑战。未来OSWare将持续推动Kanzi与开源鸿蒙生态对接,加速商业化落地,计划与头部车企合作打造智能座舱标杆案例。

  • MYAI密发仪Pro新品闪耀2025美沃斯双展,引领AI一站式养发新风潮

    2025年5月9-11日,2025美沃斯国际医学美容大会将在杭州国际博览中心举行。会前,MYAI品牌携新品"MYAI密发仪Pro"亮相Moly Gala 2025中国时尚美学盛典,斩获"年度最佳新锐品牌"奖项。该产品整合AI头皮检测系统、专家级分型方案定制及光电生物科技,首创"院线检测+个性化定制"一站式头皮健康管理方案。产品采用660nm环形红光和EMS微电流技术,新增1064nm透皮胶原原光技术,并植入太赫兹芯片实现四效合一。MYAI主张"先检测再定制"理念,基于40万头皮样本数据库,通过AI算法提供个性化养发方案。品牌创始人表示将持续推出分型防脱精华矩阵,满足不同用户需求。该产品创新性地将AI科技与专业养发结合,推动行业向智能化、精准化发展。

  • 价格高达3500美元?三星三折叠手机G Fold或仅在两个国家发售

    传闻称,其售价将从 3000 美元起跳,顶配版本高达 3500 美元,具体价格依配置而定……

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。