首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

英伟达 H100 在 MLPerf AI 性能测试刷新纪录:11 分钟不到完成 GPT-3 大模型训练

2023-06-28 09:05 · 稿源:站长之家

站长之家(ChinaZ.com) 6月28日消息:MLPerf 基准测试是评估系统在一系列人工智能工作负载下的性能表现的重要指标。人工智能正在快速发展,生成式人工智能工作负载日益突出,而 MLPerf 也在与行业一起不断进化。其最新的 MLPerf Training v3.0 基准套件引入了推荐引擎和大型语言模型(LLM)训练的新测试。

nvidia-culitho,英伟达,芯片

MLCommons 负责监督 MLPerf,并于今天发布了最新的 MLPerf 基准测试结果英伟达 H100 几乎在每个类别中占据主导地位,并成为新 LLM 基准测试中唯一使用的 GPU。

在 LLM 和 BERT 自然语言处理(NLP)基准测试中,英伟达和 Inflection AI 共同开发的系统在 CoreWeave 上表现最佳。这家云服务提供商专注于大规模 GPU 加速工作负载。可以说,这些数据令人印象深刻。

英伟达 H100 在每个基准测试中均刷新了最佳记录

MLPerf LLM 基准测试基于 OpenAI 的 GPT-3 LLM,训练了 1750 亿个参数(GPT-3 是该基准测试创建时最新一代的 GPT)。训练 LLM 是一项计算密集型任务,Lambda Labs 估计,训练 1750 亿个参数的 GPT-3 需要约 3.14E23 次计算浮点运算(FLOPS)。这需要大量昂贵的计算资源。

英伟达专为这些工作负载设计了 H100 Tensor Core GPU,并迅速成为训练大型语言模型中最受欢迎的加速器之一。这是有充分理由的。英伟达在 H100 中引入了新的 Transformer 引擎,专门用于加速 Transformer 模型的训练和推断(英伟达在一篇博文中对该设备的全部功能进行了出色的描述)Transformer 是生成式人工智能的核心,因此预期 H100 的性能应优于以前的一代。英伟达表示,H100 上的所有内容都更快,新的 Transformer 引擎将训练加速高达 6 倍。

在今天的结果中,90 个系统中有 82 个使用了英伟达加速器(除了 18 个非英伟达系统中的一个外,其余所有系统均由英特尔提交)。将近一半的结果基于英伟达 H100 Tensor Core GPU。英伟达 H100 在 MLPerf 训练和推断基准测试中创下了记录,而英伟达的 A100 和 L4 GPU 提供了出色的推断结果。

更深入地了解指标,英伟达 H100 Tensor Core GPU 的每个加速器 LLM 训练时间为 548 小时(约 23 天)。该 GPU 在每个基准测试中也刷新了每个加速器的记录。

大规模 LLM:英伟达 + Inflection AI + CoreWeave

查看每个加速器的结果很有趣,但现实世界的生产工作负载很少使用单个加速器构建。在具有多个 GPU 的集群系统中,会出现规模效益,英伟达从一开始就考虑到了这一点,其持续关注使用其 NVLink 技术进行 GPU 间通信的规模化 GPU 集群。了解实际性能需要从系统级别来看结果。

英伟达和 Inflection AI 共同开发了一个基于英伟达 H100 Tensor Core GPU 的大规模 GPU 集群系统,由 Coreweave 托管和测试。该系统组合了 3,584 个英伟达 H100 加速器和 896 个第四代英特尔 Xeon Platinum 8462Y+处理器。结果令人震撼,在测试的每个工作负载上都创下了新纪录。

深入研究 LLM 基准测试展示了英伟达技术的全部能力。这个由 3,854 个 GPU 组成的集群在大规模基于 GPT-3 的训练基准测试中完成时间不到 11 分钟,而只有一半数量的 GPU 的配置则需要将近 24 分钟,展示了英伟达 H100 GPU 的非线性可扩展潜力。

英特尔是唯一另一个报告 LLM 基准测试结果的实体。英特尔的系统结合了 64-96 个英特尔 Xeon Platinum 8380 处理器和 256-389 个英特尔 Habana Gaudi2 加速器。英特尔报告了其最高配置的 LLM 训练时间为 311 分钟。

分析师观点

基准测试提供了系统的时点比较。几乎所有提交的结果都基于英伟达加速器,这表明英伟达在人工智能生态系统中的持续主导地位。尽管这种主导地位在很大程度上基于其加速器技术,但英伟达在生态系统中的黏性仍然在很大程度上受到 AI 社区对其软件的依赖。

英伟达不仅提供底层的 CUDA 库和工具,几乎所有 AI 框架都是基于它们开发的,该公司还在软件层面上提供全套的 AI 工具和解决方案。除了支持 AI 开发人员外,英伟达还不断投资于管理工作负载和模型的企业级工具。英伟达在行业中在软件方面的投资是无与伦比的,并将在可预见的未来继续保持领先地位。虽然会有非英伟达的训练解决方案出现,但它们将继续是例外。

从 MLPerf 结果中得出的最重要结论不仅仅是英伟达的新一代 H100 Tensor Core 加速器的原始性能,而是在云中运行 AI 训练工作负载的强大和高效性。构建任何规模的训练集群都是一项昂贵且复杂的任务。尽管英伟达没有公布 H100 加速器的定价,但估计每个加速器的价格在 3 万至 4 万美元之间。CoreWeave 提供每小时 2.23 美元的租用服务,可以提供与现场实际安装的相媲美的训练结果(此外,值得一提的是,目前还无法从任何顶级公共云提供商那里获得 H100 的使用时间;目前没有 CSP 提供基于 H100 的实例)。

人工智能正在改变我们与技术互动的方式,改变企业的运作方式以及我们理解周围数据的方式。英伟达处于这场革命的中心,迅速扩大其在几乎所有数据中心元素中的存在。英伟达不再只是我们成长过程中的游戏图形公司,而是迅速成为我们集体未来的关键推动者。

举报

  • 相关推荐
  • 大家在看
  • 开拍:AI视频剪辑工具,提升视频质量,增强创作体验。

    开拍是一款利用人工智能技术提供视频剪辑服务的在线平台,通过AI算法优化视频画质、消除水印、自动生成字幕等,旨在帮助用户提升视频制作效率和质量。产品背景信息显示,开拍致力于解决视频创作过程中的常见问题,如画质不清晰、水印去除困难、字幕添加繁琐等,通过技术手段简化视频编辑流程,让视频创作更便捷、高效。

  • 即刻动态开盒Bot:分析即刻动态,了解朋友的趣味成分。

    即刻动态开盒Bot是一个在线工具,通过分析用户上传的即刻动态截图,揭示用户的兴趣爱好和社交行为。它利用人工智能技术,对图片中的文字和图像进行分析,从而得出用户的个性标签。这个工具不仅增加了社交媒体互动的趣味性,也帮助用户更深入地了解自己和他人。

  • 你和狗的区别:探索你和狗的相似与不同,发现更多趣味互动。

    这是一个提供趣味互动和娱乐内容的网站,通过轻松幽默的方式让用户探索与狗的相似之处,同时提供其他多种娱乐功能,如星座运势、歌词接龙等,旨在为用户带来轻松愉快的体验。

  • FineChatBI:AI驱动的对话式业务分析工具

    FineChatBI是帆软推出的一款AI驱动的对话式业务分析工具,它利用Text2DSL技术将用户的自然语言问题转化为可理解、可干预的指令,从而提供可控、结果可信、分析闭环、交互友好的业务分析体验。该产品基于企业级BI能力底座,结合AI技术,大幅降低业务分析门槛,提升企业决策效率。

  • Pony Diffusion:多功能文本到图像扩散模型,生成高质量非真实感图像。

    Pony Diffusion V6 XL是一个文本到图像的扩散模型,专门设计用于生成以小马为主题的高质量艺术作品。它在大约80,000张小马图像的数据集上进行了微调,确保生成的图像既相关又美观。该模型采用用户友好的界面,易于使用,并通过CLIP进行美学排名,以提升图像质量。Pony Diffusion在CreativeML OpenRAIL许可证下提供,允许用户自由使用、再分发和修改模型。

  • TarotCard.Art:AI算法融合古老智慧,生成个性化塔罗牌。

    TarotCard.Art——AI个性化塔罗牌生成器是一款结合了古老塔罗智慧与现代AI技术的在线工具,旨在为用户提供个性化的塔罗牌解读体验。用户可以通过输入问题或描述,利用AI算法生成独特的塔罗牌,并获得相应的解读。该产品不仅为塔罗爱好者提供了一种新颖的体验方式,也为寻求指导和灵感的用户提供了一个有趣的平台。

  • AI Describe Pictures:AI技术快速生成图片描述

    AI Describe Pictures是一个利用人工智能大模型构建的平台,能够快速为图片生成详细或简要的描述。它通过AI技术,不仅能够描述图片中的场景和人物,还可以根据用户的需求提供定制化的描述方式。该产品通过AI技术的应用,极大地提高了图片描述的效率和准确性,对于视觉障碍人士、内容创作者和需要图片描述的各类场景都具有重要的意义。

  • AI回复生成器:AI辅助,快速生成个性化回复。

    AI回复生成器是一款革命性的沟通工具,旨在帮助用户创建个性化、符合上下文的回复。无论是撰写电子邮件、回应客户咨询还是生成内容,我们的AI系统确保您的信息清晰、简洁且针对您的受众量身定制。

  • Tools-AI.xyz:探索2024最佳AI应用

    Tools-ai.xyz 是一个致力于探索和分享2024年最佳AI应用的平台,它提供了一个全面的AI应用列表,这些应用覆盖了写作、图像、视频、编程、设计等多个领域。该平台由GPT-4o每天不间断更新,确保用户能够获取到最新的AI工具信息。

  • 小红书MBTI人格测试:通过大数据分析,揭示你的MBTI人格特质。

    小红书MBTI人格测试是一个基于大数据分析的在线测试工具,它通过分析用户在小红书上的行为和内容,为用户提供个性化的MBTI人格分析。这种分析可以帮助用户更好地了解自己的性格特点、优势和潜在的发展方向。产品通过幽默风趣的语言和个性化的分析结果,增强了用户体验,同时也为用户提供了自我探索和自我提升的机会。

  • AI Headshot Generator Free:使用AI技术,免费生成专业头像。

    AI Headshot Generator Free是一款利用人工智能技术为用户提供专业级头像生成服务的网站。用户只需上传自己的自拍照片,AI技术便能在约20分钟内自动调整光线、去除背景并增强面部特征,生成高质量的头像。这项技术特别适合需要在LinkedIn、简历或任何专业档案中展示形象的用户。产品背景信息显示,它由一家位于英格兰的公司创立,注重用户隐私。

  • Patched:自动化代码审查、文档和补丁的开源工作流自动化框架。

    Patched是一个开源的工作流自动化框架,专为开发团队设计,通过集成大型语言模型(LLMs)来自动化代码审查、文档生成、补丁生成等开发任务。它通过提供预设的patchflows或允许用户自定义patchflows来加速日常开发工作。Patched支持与现有的开发和安全解决方案集成,如Gitlab、GitHub、Jira等,使得开发人员能够构建复杂的多步骤工作流。Patched强调隐私优先,支持在用户自己的基础设施内部署,并使用自己的LLM API密钥。

  • AI Signature Generator.com:免费创建个性化签名

    AI Signature Generator是一个在线工具,使用人工智能技术帮助用户创建个性化的签名。用户只需输入全名或首字母,AI即可生成多种风格的签名供用户选择。这项技术简化了签名设计过程,使得用户无需具备专业设计技能即可获得美观且专业的签名。该工具完全免费,适合需要快速生成电子签名的用户,无论是个人使用还是商业场合,都能提供便利。

  • AI Fill Image:利用AI技术无缝扩展图像

    AI Fill Image是一个免费的在线图像填充工具,它使用先进的AI技术来自动填充图像周围的空白区域,同时保持原始风格和内容。这项技术的重要性在于它能够无缝地扩展图像,为设计师和摄影师提供了一种创新的方式来增强他们的创意项目。产品背景信息显示,AI Fill Image适合所有类型的图像,尤其是那些具有清晰图案和结构的图像。

  • Brat Generator:创造Charli XCX专辑风格的图片

    Brat Generator是一个在线工具,允许用户创建具有Charli XCX专辑风格的图片。它提供了一个简单易用的界面,用户可以通过选择不同的背景颜色来个性化他们的图片。这个工具特别适合那些想要快速生成具有特定艺术风格图像的用户。

  • RAGLAB:模块化研究导向的检索增强生成统一框架

    RAGLAB是一个模块化、研究导向的开源框架,专注于检索增强生成(RAG)算法。它提供了6种现有RAG算法的复现,以及一个包含10个基准数据集的全面评估系统,支持公平比较不同RAG算法,并便于高效开发新算法、数据集和评估指标。

  • 01 App:将智能设备控制权交到您手中。

    01 App是一个基于iOS和Android的应用程序,它通过简单的按键对讲界面,允许用户从世界任何地方控制Mac、Windows和Linux机器。该应用代表了一种新型的计算平台,专注于软件而非硬件,通过提供更好的SDK、集成语音模型、提高教学模式的可靠性和增加多模态功能来增强用户体验。01 App的推出,是为了让用户能够更便捷地体验到01平台的智能设备控制能力,同时避免了制造硬件所带来的复杂性和成本。

  • 分歧终端机pingli.app:让AI帮你解决分歧

    分歧终端机是一个在线平台,通过AI技术帮助用户解决日常生活中的分歧和争议。它通过模拟裁判的方式,让用户提交问题并由AI进行投票,从而得出一个相对客观的结果。这种技术的应用不仅增加了决策的趣味性,也提高了决策的效率,尤其适合在朋友之间或小团体内部解决小争议。

  • Alorica:实时语音语言翻译解决方案

    Alorica ReVoLT是Alorica Clear解决方案的一部分,属于其革命性的多语言客户体验产品套件。这项技术通过实时语音语言翻译,帮助客户提升品牌影响力,优化客户服务体验。Alorica ReVoLT在2024年AI突破奖中被评为最佳基于AI的客户服务解决方案,凸显了其在客户体验管理(CXM)领域的领先地位。

  • Chai-1:先进的多模态基础模型,用于分子结构预测。

    Chai-1是一个用于药物发现的多模态基础模型,能够预测蛋白质、小分子、DNA、RNA、共价修饰等的分子结构。它在PoseBusters基准测试中达到了77%的成功率,与AlphaFold3相当。Chai-1无需多序列比对即可运行,保持了大部分性能,并且能够更准确地折叠多聚体结构。此外,Chai-1可以与实验室数据结合,提高预测性能。该模型旨在将生物学从科学转变为工程,推动AI在生物学研究中的应用。

今日大家都在搜的词: