首页 > 业界 > 关键词  > Gaudi2最新资讯  > 正文

英特尔开始推出Habana Labs Gaudi2 Linux驱动程序代码

2022-06-28 13:45 · 稿源: cnbeta

在上月的 VISION 会议上,英特尔宣布了 Gaudi2 硬件。作为该公司旗下 Habana Labs 用于训练和推力的第二代加速器,它也同步迎来了开源 Linux 内核驱动 / 用户空间软件堆栈更新。英特尔宣称 Gaudi2 的 AI 训练性能是英伟达 A100 竞品方案的两倍,且芯片制造工艺也从初代 16nm 升级到了 7nm 。

此外 Gaudi2 迎来了 3 倍的 TPC 改进,32GB HBM2 高带宽内存增加到了 96GB HBM2e、SRAM 缓存也翻倍到了 48MB,辅以 24×100 GbE 连接,但热设计功耗(TDP)也从 350W 提升到了 600W 。

在发布一个多月后,Habana Labs Gaudi2 的开源驱动程序工作也在有条不紊地推进中。而当前的 Gaudi2 支持,正好建立在现有的 Gaudi 和 Goya 加速器内核驱动程序(habanalabs)的基础上。

2.jpg

Habana.ai 白皮书揭示了与 Gaudi2 架构相关的更多信息

从驱动角度来看,Gaudi2 与初代非常接近,整体架构也是一个样。启用 Gaudi2 大约需要 15.8 万行新内核代码,但其中大部分属于“头文件”(AMDGPU 内核驱动程序也有大量头文件)。

截至目前,新的头文件主要代表了该主线驱动程序启用 Gaudi2 支持所需的大部分代码变动。除了内核驱动工作,英特尔今日还发布了 TPC_LLVM 1.1(针对 Habana Labs 加速器的新版开源编译器)。

3.jpg

TPC_LLVM 1.1 添加了对 Gaudi2 及新的 Greco ASIC 编译器的支持

与此同时,英特尔也在努力更新 SynapseAI Core for Gaudi2 开源组件,新补丁系列用于新的 Gaudi2 内核驱动程序代码。

鉴于新版是从相同的 Gaudi 架构演变而来,预计后续的代码审核工作也会相当顺利,那样我们就有望在 v5.20 内核周期内尽快添加对 Intel Gaudi2 的支持。

最后,英特尔还在 VISION 2022 会议上宣布了从 Goya 升级而来、针对深度学习应用而作出效率优化的 Greco 加速卡。

举报

  • 相关推荐
  • 英特尔举办工业AI与具身智能生态大会,加速智造升级

    在2025年中国国际工业博览会上,英特尔携手生态伙伴以“工业+AI”为核心,展示了具身智能、人形机器人、工业AI与大模型等前沿解决方案。发布了基于酷睿Ultra平台的工厂落地案例,实现“大小脑融合”从概念到真实工业场景的跨越。通过全栈式边缘AI技术体系,为智慧工厂等行业智能化转型提供支撑。英特尔将持续推动开放平台与工业场景结合,加速智能制造发展。

  • 英特尔联动「扣子 AI 工坊」启动高校计划——让校园创意一键开挂

    英特尔与新一代AI平台扣子联合发起“英特尔×扣子AI工坊高校计划”,旨在通过校企合作推动AI技术在教育领域的深度融合。该计划以校园场景化实践为核心,通过线下工作坊、创新挑战赛等形式,将前沿AI工具引入高校,帮助学生掌握AI应用能力。活动覆盖全国数百所高校,结合酷睿Ultra处理器的硬件优势,让学生直观体验AI在创作、学习等场景的高效赋能。未来双方计划深化课程共建与就业对接,构建AI教育新生态,助力青年适应智能时代发展需求。

  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • 音质升级 焕新登场 三星Galaxy Buds3 FE正式上市

    三星Galaxy智能新品于9月19日正式开售,包括Tab S11 Ultra、Tab S11、Tab S10 Lite平板及Buds3 FE耳机。新品搭载AI功能,支持多设备互联,提供大屏交互、专业音频体验。Tab S11 Ultra起售价8999元,Tab S11起售5999元,Tab S10 Lite起售2599元,Buds3 FE售价949元。即日起消费者可通过线上线下渠道购买,享受购机好礼。

  • 同传翻译 流畅交流 三星Galaxy Buds3 FE出境游必备

    十一假期临近,三星Galaxy Tab S11系列平板与Galaxy Buds3FE等智能新品成为旅行好帮手。Tab S11通过大屏与AI功能简化行程规划、购票等准备工作,支持智能拖拽分屏提升效率;Buds3FE则提供实时翻译功能,解决出境游语言障碍。两者结合让旅行更轻松,回归纯粹享受。

  • 囤LABUBU的黄牛哭了:根本没人接盘

    曾经一娃难求的LABUBU目前在二手交易平台全线下跌。 在二手交易平台闲鱼上,LABUBU的挂售数量明显增加,卖家们纷纷降价,有的卖家标注亏本卖”、求回血”等字样。 目前不少黄牛已经暂停收货LABUBU,一位黄牛表示,我从事潮玩转手已经两年了,LABUBU一直是硬通货,但这次市场反应完全出乎意料,我手里还压着没有出手,估计要亏好几千。 另一方面,由于价格下跌,不少�

  • BYDFi 亮相 KBW2025:深化 Web3 交流与参与

    全球加密交易平台于2025年9月23日至24日参与韩国首尔举办的Korea Blockchain Week 2025(KBW2025),在Walkerhill酒店主会场设置展位并开展现场互动。这是BY DFi成为纽卡斯尔联队官方合作伙伴后首次亮相大型行业活动,团队还出席多场边会及社交活动。在展会分享其“双引擎战略”——同步布局中心化与链上交易,重点介绍链上工具MoonX,强调通过安全设计、产品完善及合规进�

  • 华为云GaussDB将接入全球首个通算超节点 性能提升2.9倍

    华为在第十届全联接大会上发布基于TaiShan950超节点的GaussDB多写架构,性能提升2.9倍,每分钟可处理540万笔事务。该架构实现计算、内存、存储三层资源池化,支持秒级故障恢复,可平滑替代传统数据库。GaussDB已应用于金融、政务等关键行业,在中国数据库市场以13.9%份额首次超越Oracle登顶。华为通过20余年研发实现全栈自主创新,标志着中国数据库技术从跟随到引领的关键跨�

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • Claude 用不了?蓝耘 Coding Agent 提供原生替代方案,更轻量、高性价比的替代选择

    Anthropic宣布停止向中国资本控股企业提供Claude服务,蓝耘Coding Agent凭借强代码能力、灵活适配性及高性价比成为可靠替代选择。支持多模型切换、低迁移成本,提供可视化控制台和本地化服务,助力开发者无缝衔接开发流程,确保工作连续性。

今日大家都在搜的词: