研究称：英特尔Gaudi2技术在大语言模型推理方面媲美英伟达AI加速器

2024-01-05 10:04 · 稿源：站长之家

划重点:
- 📌 研究显示，英特尔的 Gaudi2技术在大规模语言模型推理方面与英伟达的 AI 加速器相媲美。
- 📌 Gaudi2的推理性能在解码方面与英伟达 H100系统相当，并且优于英伟达 A100。
- 📌 根据公共云定价，Gaudi2在训练和推理方面的性价比都超过了英伟达的 A100和 H100。

站长之家（ChinaZ.com）1月5日消息:根据 Databricks 的最新研究，英特尔的 Gaudi2技术在大规模语言模型推理方面与业界领先的英伟达 AI 加速器相媲美。该研究发现，Gaudi2在解码方面的延迟与英伟达 H100系统相当，并且优于英伟达 A100。研究还发现，Gaudi2的推理性能比 H100和 A100实现了更高的内存带宽利用率。

不过，英伟达在顶级加速器的训练性能上仍然更强大。研究人员使用 Databricks 的 MosaicML LLM 工厂进行训练，发现 Gaudi2在单节点 LLM 训练性能方面仅次于英伟达 H100，达到了每芯片超过260TFLOPS 的性能。总体而言，根据公共云定价，Databricks 的研究报告显示，与 A100和 H100相比，Gaudi2在训练和推理方面具有最佳的性价比。

英特尔通过 MLcommons MLperf 基准测试来提供有关 Gaudi2训练和推理性能的自己的测试结果。Databricks 的新数据进一步验证了英特尔的 Gaudi 技术在性能方面的表现，这是来自第三方的验证。

英特尔在2019年以20亿美元收购了 AI 芯片初创公司 Habana Labs 及其 Gaudi 技术，并在此后几年中不断改进这项技术。厂商们通过参与行业标准基准测试来证明性能。无论是英伟达还是英特尔都经常参与 MLcommons MLPerf 的训练和推理基准测试，这些基准测试每年更新多次。在去年11月发布的最新的 MLPerf3.1训练基准测试中，英伟达和英特尔都声称刷新了 LLM 训练速度记录。几个月前的去年9月，也发布了 MLPerf3.1推理基准测试，英伟达和英特尔在该测试中也表现出了强劲的竞争性能。

虽然像 MLPerf 和 Databricks 的研究报告这样的基准测试非常有价值，但 Medina 指出，许多客户依靠自己的测试来确保硬件和软件堆栈适用于特定的模型和用例。他表示，软件堆栈的成熟度非常重要，因为人们对基准测试组织存在怀疑，厂商会对其进行优化以满足特定的基准测试要求。

据 Medina 介绍，MLPerf 是有其一定作用的，因为人们知道要提交结果，技术堆栈需要达到一定的成熟度水平。但他强调，客户不会依靠 MLPerf 的结果来做出业务决策。“MLPerf 的结果只是组织在进行测试之前使用的成熟度过滤器”，Medina 说道。

就在准备于2024年推出 Gaudi3AI 加速器技术之际，有关 Gaudi2的新数据也发布出来了。Gaudi2是采用7纳米工艺开发的，而 Gaudi3基于5纳米工艺，并将提供4倍的处理能力和双倍的网络带宽。Medina 表示，Gaudi3将于2024年发布并开始大规模生产。“Gaudi3是一个将 Gaudi2的性能优势发挥到极致的产品，它在性能上有了巨大的飞跃，从而在性价比和性能功耗比方面带来了优势。”

英特尔正在致力于将公司的高性能计算和 AI 加速器技术融合在一起。英特尔也继续看好其用于 AI 推理工作负载的 CPU 技术。英特尔最近宣布推出带有 AI 加速功能的第五代 Xeon 处理器。

“CPU 在推理中仍然占有相当大的比例，甚至微调在 CPU 上也可能有优势”，Medina 说道。“CPU 参与数据准备，并且当 AI 的计算密度极高时，它们与 Gaudi 加速器一起提供解决方案。因此，我们的总体策略是提供一系列解决方案。”

（举报）

相关推荐

关键词：

苹果自研AI模型难产：改用第三方大语言模型

苹果可能会跟OpenAI或Anthropic合作，双方正在谈判讨论一项潜在交易，苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。据悉，OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型，苹果也在进行测试，目前苹果发现Anthropic的AI模型最适合Siri，且与Anthropic初步讨论了一些财务条款，消息称Anthropic要求苹果每年支付数十亿美元的费用，且该费用会随时间�

苹果 Siri OpenAI
荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

本文介绍了AI领域多项重要进展：1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen，显著提升建模效率；2)阿里发布多模态大模型HumanOmniV2，准确率达69.33%；3)钉钉AI表格实现1小时处理千项任务；4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级；5)微软推出Deep Research智能体，自动化研究流程；6)香港理工与OPPO联合开源视频超清框架DLoRAL；7)谷歌开源MCP工具箱简化AI与数据库集成；8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。
模型推理协作正式开启，魔乐社区让模型跑遍“中国芯”

魔乐社区启动"模型推理适配协作计划"，旨在解决国产算力平台与大模型间的适配难题。该计划通过开源协作模式，联合开发者、芯片厂商等生态伙伴，构建从工具链到知识库的全栈支持体系，打造适配成果共享平台。重点支持开源大模型在国产硬件及多样化推理引擎上的高效运行，提供模型转换工具和优化指南，降低开发门槛。目前已有文心大模型4.5等首批适配成果�

人工智能大模型国产算力平台
攀升科技携手英伟达亮相BW2025，RTX主机限时福利大放送

7月11-13日，攀升科技以"乐玩AI+趣享攀升"为主题亮相Bilibili World 2025展会。现场设立GeForce RTX体验区，玩家可试玩《永劫无间》等游戏，感受RTX50系列显卡带来的极致画质和DLSS4技术。重点展示AI技术在游戏中的创新应用，如通过NVIDIA ACE技术实现AI队友语音互动。展会期间推出多款优惠主机：RTX5060主机搭载i5-14600KF处理器，48G DDR5内存，享政府补贴后到手价优；RTX5070主机采用Blackwell架构，AI算力达988TOPS，原价10699元，补贴后仅8699元。攀升科技诚邀玩家亲临4A18展位体验RTX技术魅力。
攀升科技携手英伟达亮相BW2025，RTX主机限时福利大放送

攀升科技将于7月11-13日亮相Bilibili World 2025展会，以"乐玩AI+趣享攀升"为主题，携手英伟达带来RTX50系列显卡体验。现场可试玩《永劫无间》《漫威争锋》等游戏，体验全景光线追踪和DLSS4技术。重点展示AI在游戏中的创新应用，如通过NVIDIA ACE技术创建智能NPC队友。展会期间推出RTX5060/5070主机优惠，5060主机搭载i5-14600KF处理器和48G DDR5内存，5070主机AI算力达988TOPS，支持DLSS4技术。参与现场活动可获购机福利，抖音旗舰店下单享政府补贴最高立省2000元。展会地点为上海国家会展中心4A18展位。
微软定制 AI 芯片遭遇延期为英伟达提供更多发展空间

微软 Braga 芯片因研发挫折不断，无法在 2026 年前问世……

微软定制AI芯片英伟达 AI芯片
英伟达成首家市值超4万亿美元公司

科技巨头英伟达在资本市场大放异彩，股价上涨2.5%，报收于163.9美元/股，凭借这一表现，其总市值成功攀升至4万亿美元，一举成为全球首家市值突破这一惊人关口的公司，再次刷新了资本市场的纪录。在全球市值排名中，英伟达稳坐头把交椅，微软以3.74万亿美元的市值位居第二，苹果则以3.14万亿美元位列第三。

英伟达市值科技巨头人工智能
英伟达Blackwell Ultra芯片商用落地，微美全息以“算力+开源”领航AI科技新程

英伟达与CoreWeave合作推出新一代AI芯片Blackwell Ultra，该芯片已实现商业部署，采用液冷技术，包含72个GPU和36个CPU。Blackwell Ultra的AI内容生成能力是前代产品的50倍，预计今年批量出货。英伟达凭借高性能AI芯片近乎垄断市场，年利润超5000亿元，市值逼近4万亿美元，有望成为全球市值最高公司。微软推迟自研AI芯片发布，转向过渡性设计方案。微美全息专注AI芯片技术布局，构建多元化技术生态，推动产业协同，成为全球AI芯片竞赛重要参与者。当前AI产业进入大规模商业化关键阶段，算力需求持续高涨，推动企业向算力数智化迁移。消费电子领域，AI赋能传统智能终端，新型智能硬件结合AI创造增量需求，关注算力产业链技术创新配套机遇。
英伟达股价创新高市值3.89万亿美元

在7月4日美国独立日假期前的短暂交易日中，英伟达（NVDA.US）股价强劲上涨1.33%，盘中一度触及历史新高160.98美元，最终市值定格在3.89万亿美元，这一成绩不仅彰显了英伟达在资本市场的非凡实力，更标志着其成为全球科技产业的新标杆。

英伟达市值人工智能
AI与量子科技融合浪潮来袭，英伟达/微美全息竞速抢抓量子计算战略机遇期

湖南湘江新区正加速推动量子科技从实验室走向应用，量子产业初具规模。湖南长期深耕量子技术研发，推动量子科技实现从技术到产业的跨越。量子计算作为前沿技术，已在金融、医药等领域进入应用探索阶段。英伟达CEO黄仁勋预测量子计算将迎来拐点，未来几年可解决现实问题。微美全息等企业正构建量子计算生态，开发基于FPGA的数字量子协处理器，突破现有硬件局限。量子计算商用仍需10-20年发展，但已成为大国核心技术竞争领域，各国加大政策支持力度。量子科技发展将增强技术自主能力，是科技创新的重要里程碑。

量子科技量子计算科技创新

热文

3 天
7天

1

腾讯客服回应误删微信聊天记录可撤销：苹果iOS机型已支持

研究称：英特尔Gaudi2技术在大语言模型推理方面媲美英伟达AI加速器

苹果自研AI模型难产：改用第三方大语言模型

荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

模型推理协作正式开启，魔乐社区让模型跑遍“中国芯”

攀升科技携手英伟达亮相BW2025，RTX主机限时福利大放送

攀升科技携手英伟达亮相BW2025，RTX主机限时福利大放送

微软定制 AI 芯片遭遇延期为英伟达提供更多发展空间

英伟达成首家市值超4万亿美元公司

英伟达Blackwell Ultra芯片商用落地，微美全息以“算力+开源”领航AI科技新程

英伟达股价创新高市值3.89万亿美元

AI与量子科技融合浪潮来袭，英伟达/微美全息竞速抢抓量子计算战略机遇期

热文

腾讯客服回应误删微信聊天记录可撤销：苹果iOS机型已支持

AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模

小米回应AI眼镜没有屏显功能：专注拍摄、AI语音交互

比特币首触112000美元：盘中涨幅最高达3%

微信：持续打击非法使用外挂行为进一步强化外挂营销信息治理

OPPO K13 Turbo系列官宣将于7月21日发布内置散热风扇

荣耀X70支持IP66/IP68/IP69/IP69K 号称行业最高规格防水

小米汽车交付超30万辆：用时仅15个月

REDMI Turbo 4 Pro粉金新配色发布售价1899元起

周杰伦发布第一条抖音视频：回顾成长史粉丝超1200万

站长商机