首页 > 业界 > 关键词  > Gaudi2最新资讯  > 正文

研究称:英特尔Gaudi2技术在大语言模型推理方面媲美英伟达AI加速器

2024-01-05 10:04 · 稿源:站长之家

划重点:

- 📌 研究显示,英特尔的 Gaudi2技术在大规模语言模型推理方面与英伟达的 AI 加速器相媲美。

- 📌 Gaudi2的推理性能在解码方面与英伟达 H100系统相当,并且优于英伟达 A100。

- 📌 根据公共云定价,Gaudi2在训练和推理方面的性价比都超过了英伟达的 A100和 H100。

站长之家(ChinaZ.com)1月5日 消息:根据 Databricks 的最新研究,英特尔的 Gaudi2技术在大规模语言模型推理方面与业界领先的英伟达 AI 加速器相媲美。该研究发现,Gaudi2在解码方面的延迟与英伟达 H100系统相当,并且优于英伟达 A100。研究还发现,Gaudi2的推理性能比 H100和 A100实现了更高的内存带宽利用率。

不过,英伟达在顶级加速器的训练性能上仍然更强大。研究人员使用 Databricks 的 MosaicML LLM 工厂进行训练,发现 Gaudi2在单节点 LLM 训练性能方面仅次于英伟达 H100,达到了每芯片超过260TFLOPS 的性能。总体而言,根据公共云定价,Databricks 的研究报告显示,与 A100和 H100相比,Gaudi2在训练和推理方面具有最佳的性价比。

image.png

英特尔通过 MLcommons MLperf 基准测试来提供有关 Gaudi2训练和推理性能的自己的测试结果。Databricks 的新数据进一步验证了英特尔的 Gaudi 技术在性能方面的表现,这是来自第三方的验证。

英特尔在2019年以20亿美元收购了 AI 芯片初创公司 Habana Labs 及其 Gaudi 技术,并在此后几年中不断改进这项技术。厂商们通过参与行业标准基准测试来证明性能。无论是英伟达还是英特尔都经常参与 MLcommons MLPerf 的训练和推理基准测试,这些基准测试每年更新多次。在去年11月发布的最新的 MLPerf3.1训练基准测试中,英伟达和英特尔都声称刷新了 LLM 训练速度记录。几个月前的去年9月,也发布了 MLPerf3.1推理基准测试,英伟达和英特尔在该测试中也表现出了强劲的竞争性能。

虽然像 MLPerf 和 Databricks 的研究报告这样的基准测试非常有价值,但 Medina 指出,许多客户依靠自己的测试来确保硬件和软件堆栈适用于特定的模型和用例。他表示,软件堆栈的成熟度非常重要,因为人们对基准测试组织存在怀疑,厂商会对其进行优化以满足特定的基准测试要求。

据 Medina 介绍,MLPerf 是有其一定作用的,因为人们知道要提交结果,技术堆栈需要达到一定的成熟度水平。但他强调,客户不会依靠 MLPerf 的结果来做出业务决策。“MLPerf 的结果只是组织在进行测试之前使用的成熟度过滤器”,Medina 说道。

就在准备于2024年推出 Gaudi3AI 加速器技术之际,有关 Gaudi2的新数据也发布出来了。Gaudi2是采用7纳米工艺开发的,而 Gaudi3基于5纳米工艺,并将提供4倍的处理能力和双倍的网络带宽。Medina 表示,Gaudi3将于2024年发布并开始大规模生产。“Gaudi3是一个将 Gaudi2的性能优势发挥到极致的产品,它在性能上有了巨大的飞跃,从而在性价比和性能功耗比方面带来了优势。”

英特尔正在致力于将公司的高性能计算和 AI 加速器技术融合在一起。英特尔也继续看好其用于 AI 推理工作负载的 CPU 技术。英特尔最近宣布推出带有 AI 加速功能的第五代 Xeon 处理器。

“CPU 在推理中仍然占有相当大的比例,甚至微调在 CPU 上也可能有优势”,Medina 说道。“CPU 参与数据准备,并且当 AI 的计算密度极高时,它们与 Gaudi 加速器一起提供解决方案。因此,我们的总体策略是提供一系列解决方案。”

举报

  • 相关推荐
  • 活字格通过信通院智能体专项测试,以All-in-One能力加速企业AI落地

    葡萄城自主研发的活字格低代码开发平台近日通过中国信息通信研究院“智能体平台”能力专项测试,成为首批完成测试的企业。该平台凭借All-in-One智能体开发架构,覆盖数据管理、模型接入、插件开发等八大能力域,具备强集成、高安全、易扩展特性。测试结果显示其AI开发能力达行业认可水平,可为企业提供低门槛智能体落地解决方案,已在制造、政务、医疗等领域深度应用,助力企业数字化转型。

  • 古怪加速器两周年 永久时长卡免费送 错过手慢无

    古古怪怪加速器迎来两周年庆,推出超值福利:全场套餐最低六折起,买一送一更划算。参与活动可抽永久时长卡,最高得500小时SVIP。加速器每日免费16小时可暂停,拥有海量海外节点,内置掉线保护、多线切换等功能,解决游戏卡顿延迟问题。内置帧数大师等工具提升游戏流畅度,搭配AI优化降低电脑温度。现在打开即可领20小时免费时长,机不可失!

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • 双11“换芯” 阿里妈妈AI按下加速键

    ​今年双11的不同,在平台对外披露的商家案例中得以一窥究竟。 AI智能选品、AI智能出价、AI智能调控投放节奏..... 这些营销策略的表述来自音箱品牌Marshall,双11第一波段10天活动期内,Marshall在影音电器行业品牌和店铺排名均位居第一;成交转化率提升67%,爆款成交同比增长30%。这波爆发式增长的背后,反复被CUE到的AI可以说是深藏功与名。 绝非只是平台意志的表达,

  • 前B站副总裁打造“非共识”AI陪伴,国内拿下千万用户后加速出海

    在今年东京电玩展的现场,我们第一次见到了 AI 陪伴创企心影随形的创始人刘斌新。 面前的刘斌新,像此前媒体同行描述的一样随和、健谈,他曾先后出任过百度副总监、360助理总裁、B 站副总裁,2023年,他选择了自己创业,从熟悉的游戏场景切入做一款 AI 陪伴产品,「逗逗游戏伙伴」由此诞生。 从整个 AI 陪伴品类来看,「逗逗游戏伙伴」是一个很“特别”的存在。不同�

  • EUDR认证大概需要多少钱?绿舟为您带来费用详解

    欧盟《零毁林法案》(EUDR)将于2025年底实施,中国出口企业面临合规挑战。认证成本因企业规模、供应链复杂度而异,中小型企业费用约数万元,大型企业可达数十万元。核心支出包括供应链追溯、风险评估及第三方审核。案例显示认证橡胶原料溢价达200美元/吨,但长期可通过价格溢价抵消部分成本。建议企业提前规划,采用区块链等技术提升追溯效率,并争取将中国列为低风险国家以简化流程。合规虽增加短期成本,却是提升国际竞争力和供应链转型的契机。

  • 1人开发2个月,8000元成本拿到破万DAU:年轻人的机会来了?

    如今用AI做游戏不稀奇,用AI做AI游戏也不稀奇,在B站上你可以搜到一大堆相关的内容。 但最近葡萄君发现了一款有点特别的游戏:《妹居物语》。 这款游戏的卖相属实不算好:简陋的UI、朴素的立绘、单调的场景......与其他同类产品利用AI低成本地创造刺激视觉效果的做法完全不一致。

  • AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia

    本期AI日报聚焦多领域突破:海螺AI 2.3实现视频生成技术跃升,支持双模式免费试用;豆包AI编程工具实现零基础可视化开发;马斯克推出AI百科Grokipedia;Mistral发布企业级AI开发平台;Anthropic推出金融版Claude,显著提升分析师效率;Pinterest升级AI购物助手功能;英伟达推出全能模型OmniVinci刷新性能纪录;DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

  • 世纪华通成立AI委员会 驱动全业务加速跑

    过去一年半,国内AI应用调用量暴增超300倍,世纪华通成立AI发展与管理委员会,由董事长王佶亲自挂帅。该委员会将统筹公司AI战略规划,推动技术向全业务渗透,覆盖研发、客户服务及日常办公等全链条。公司通过内外双轮驱动:对外举办AI大赛吸引人才,对内将AI工具纳入KPI考核并倾斜招聘资源。目前AI已为核心业务注入动能,未来将持续深化技术与业务融合,抢占万亿级市场先机。

  • 浅醺猫DIY鸡尾酒获20亿战略投资

    中国夜间经济正迎来结构性升级,2025年规模预计突破5.2万亿元,Z世代消费占比达52%,推动场景向沉浸式、科技化转型。在此背景下,创新品牌“浅酩猫DIY”完成20亿元战略投资,启动“全国万店工程”,以AI智能柜为核心构建微醺消费新生态。该模式结合无人零售与DIY调酒,单柜日均销量较传统便利店提升3倍,计划2026年布局10万点位,目标2028年冲击百亿美元市值。品牌通过跨

今日大家都在搜的词: