英伟达 H100 在 MLPerf AI 性能测试刷新纪录：11 分钟不到完成 GPT-3 大模型训练

2023-06-28 09:05 · 稿源：站长之家

站长之家(ChinaZ.com) 6月28日消息:MLPerf 基准测试是评估系统在一系列人工智能工作负载下的性能表现的重要指标。人工智能正在快速发展，生成式人工智能工作负载日益突出，而 MLPerf 也在与行业一起不断进化。其最新的 MLPerf Training v3.0 基准套件引入了推荐引擎和大型语言模型（LLM）训练的新测试。

nvidia-culitho，英伟达，芯片

MLCommons 负责监督 MLPerf，并于今天发布了最新的 MLPerf 基准测试结果。英伟达 H100 几乎在每个类别中占据主导地位，并成为新 LLM 基准测试中唯一使用的 GPU。

在 LLM 和 BERT 自然语言处理（NLP）基准测试中，英伟达和 Inflection AI 共同开发的系统在 CoreWeave 上表现最佳。这家云服务提供商专注于大规模 GPU 加速工作负载。可以说，这些数据令人印象深刻。

英伟达 H100 在每个基准测试中均刷新了最佳记录

MLPerf LLM 基准测试基于 OpenAI 的 GPT-3 LLM，训练了 1750 亿个参数（GPT-3 是该基准测试创建时最新一代的 GPT）。训练 LLM 是一项计算密集型任务，Lambda Labs 估计，训练 1750 亿个参数的 GPT-3 需要约 3.14E23 次计算浮点运算（FLOPS）。这需要大量昂贵的计算资源。

英伟达专为这些工作负载设计了 H100 Tensor Core GPU，并迅速成为训练大型语言模型中最受欢迎的加速器之一。这是有充分理由的。英伟达在 H100 中引入了新的 Transformer 引擎，专门用于加速 Transformer 模型的训练和推断（英伟达在一篇博文中对该设备的全部功能进行了出色的描述）。Transformer 是生成式人工智能的核心，因此预期 H100 的性能应优于以前的一代。英伟达表示，H100 上的所有内容都更快，新的 Transformer 引擎将训练加速高达 6 倍。

在今天的结果中，90 个系统中有 82 个使用了英伟达加速器（除了 18 个非英伟达系统中的一个外，其余所有系统均由英特尔提交）。将近一半的结果基于英伟达 H100 Tensor Core GPU。英伟达 H100 在 MLPerf 训练和推断基准测试中创下了记录，而英伟达的 A100 和 L4 GPU 提供了出色的推断结果。

更深入地了解指标，英伟达 H100 Tensor Core GPU 的每个加速器 LLM 训练时间为 548 小时（约 23 天）。该 GPU 在每个基准测试中也刷新了每个加速器的记录。

大规模 LLM：英伟达 + Inflection AI + CoreWeave

查看每个加速器的结果很有趣，但现实世界的生产工作负载很少使用单个加速器构建。在具有多个 GPU 的集群系统中，会出现规模效益，英伟达从一开始就考虑到了这一点，其持续关注使用其 NVLink 技术进行 GPU 间通信的规模化 GPU 集群。了解实际性能需要从系统级别来看结果。

英伟达和 Inflection AI 共同开发了一个基于英伟达 H100 Tensor Core GPU 的大规模 GPU 集群系统，由 Coreweave 托管和测试。该系统组合了 3，584 个英伟达 H100 加速器和 896 个第四代英特尔 Xeon Platinum 8462Y+处理器。结果令人震撼，在测试的每个工作负载上都创下了新纪录。

深入研究 LLM 基准测试展示了英伟达技术的全部能力。这个由 3，854 个 GPU 组成的集群在大规模基于 GPT-3 的训练基准测试中完成时间不到 11 分钟，而只有一半数量的 GPU 的配置则需要将近 24 分钟，展示了英伟达 H100 GPU 的非线性可扩展潜力。

英特尔是唯一另一个报告 LLM 基准测试结果的实体。英特尔的系统结合了 64-96 个英特尔 Xeon Platinum 8380 处理器和 256-389 个英特尔 Habana Gaudi2 加速器。英特尔报告了其最高配置的 LLM 训练时间为 311 分钟。

分析师观点

基准测试提供了系统的时点比较。几乎所有提交的结果都基于英伟达加速器，这表明英伟达在人工智能生态系统中的持续主导地位。尽管这种主导地位在很大程度上基于其加速器技术，但英伟达在生态系统中的黏性仍然在很大程度上受到 AI 社区对其软件的依赖。

英伟达不仅提供底层的 CUDA 库和工具，几乎所有 AI 框架都是基于它们开发的，该公司还在软件层面上提供全套的 AI 工具和解决方案。除了支持 AI 开发人员外，英伟达还不断投资于管理工作负载和模型的企业级工具。英伟达在行业中在软件方面的投资是无与伦比的，并将在可预见的未来继续保持领先地位。虽然会有非英伟达的训练解决方案出现，但它们将继续是例外。

从 MLPerf 结果中得出的最重要结论不仅仅是英伟达的新一代 H100 Tensor Core 加速器的原始性能，而是在云中运行 AI 训练工作负载的强大和高效性。构建任何规模的训练集群都是一项昂贵且复杂的任务。尽管英伟达没有公布 H100 加速器的定价，但估计每个加速器的价格在 3 万至 4 万美元之间。CoreWeave 提供每小时 2.23 美元的租用服务，可以提供与现场实际安装的相媲美的训练结果（此外，值得一提的是，目前还无法从任何顶级公共云提供商那里获得 H100 的使用时间；目前没有 CSP 提供基于 H100 的实例）。

人工智能正在改变我们与技术互动的方式，改变企业的运作方式以及我们理解周围数据的方式。英伟达处于这场革命的中心，迅速扩大其在几乎所有数据中心元素中的存在。英伟达不再只是我们成长过程中的游戏图形公司，而是迅速成为我们集体未来的关键推动者。

（举报）

相关推荐

关键词：

人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
英伟达总市值突破5万亿美元

10月30日，英伟达股价上涨3.2%，市值突破5万亿美元，成为全球首家达此里程碑的公司。创始人黄仁勋个人财富随之突破1800亿美元，跻身全球富豪榜第八位。今年以来，英伟达股价累计上涨54%，市值从4万亿增至5万亿仅用113天。公司透露，Blackwell及新一代Rubin芯片正推动销售增长。美国银行将目标价上调至275美元，预示股价或再涨30%，市场对其前景持续乐观。

英伟达市值科技巨头
美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨头

10月28日，苹果与微软股价同步上涨，双双突破4万亿美元市值大关，与超4.6万亿美元的英伟达共同构成全球市值最高的“三巨头”格局。微软因与OpenAI资本重组推动股价涨超3%，持有后者价值1350亿美元股权；苹果则凭借新一代iPhone强劲需求实现股价逆袭，年内首度由跌转升。英伟达仍以最高市值稳居全球第一，凸显全球科技产业对算力需求的爆发式增长。

科技股苹果微软市值突破
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫

今日大家都在搜的词：

热文

3 天
7天

英伟达 H100 在 MLPerf AI 性能测试刷新纪录：11 分钟不到完成 GPT-3 大模型训练

人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI和微软的关系没那么糟，跟英伟达也没那么好

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

英伟达总市值突破5万亿美元

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨头

易鑫正式发布汽车金融行业首个Agentic大模型

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

站长商机