首页 > 业界 > 关键词  > PonteVecchio最新资讯  > 正文

英特尔详细介绍Ponte Vecchio 性能可达英伟达A100平台的2.5倍

2022-08-23 09:15 · 稿源: cnbeta

在 Hot Chips 34 大会期间,英特尔再次详细介绍了 Sapphire Rapids HBM 处理器 + Ponte Vecchio(2-Stack)GPU 平台的潜力,称该服务器平台的性能可达英伟达 A100 竞品的 2.5 倍。英特尔首席 GPU 计算架构师 Hong Jiang 在演讲中指出,Ponte Vecchio 具有三种配置。

从单一 OAM、到配备 Xe Links 的 x4 子系统,Ponte Vecchio GPU 不仅能够单独运行、也可部署于 Sapphire Rapids 双路服务器平台之上。

1.png

其中 OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑,辅以英特尔 oneAPI 软件堆栈。

2.png

作为一个零级(Level Zero)API,其为跨架构编程支持提供了低层级的硬件接口。

3.png

oneAPI 主要特性如下:

● 提供面向其它工具和加速器设备的接口;

● 支持精细的增益控制、以及低延迟的加速器特性;

● 具有多线程设计;

● 将 GPU 作为驱动程序的一部分而提供。

4.png

性能指标方面,2-Stack Ponte Vecchio GPU 配置(如单一 OAM 上的配置),可提供高达 52 TFLOP 的 FP64 / FP32 算力。

5.png

另有 419 TFLOP 的 TF32(XMX Float 32)、839 TFLOP 的 BF16 / FP16,以及 1678 TFLOPs 的 INT8 算力。

6.png

英特尔还详细说明了 Ponte Vecchio 的缓存大小 / 峰值带宽 —— 比如 GPU 上的寄存器为 64 MB,提供 419 TB/s 的带宽。

7.png

L1 缓存也为 64 MB,带宽 105 TB/s(4:1)。L2 缓存为 408 MB,带宽 13 TB/s(8:1)。HBM 内存池高达 128 GB,辅以 4.2 TB/s(4:1)的带宽。

8.png

以下是英特尔为 Ponte Vecchio 配备的系列计算效率(compute efficiency)技术。

11.png

Register File(寄存器文件):

● Register Caching(寄存器缓存)

● Accumulators(累加器)

12.png

L1 / L2 Cache:

● Write Through(直写)

● Write Back(回写)

● Write Streaming(流式写入)

● Uncached(不缓存)

13.png

Prefetch(预取):

● 支持 L1 和(或)L2 缓存的软件(指令)预取;

● 支持到 L2 获取指令和数据的 Command Streamer 预取。

14.png

英特尔解释称,更大的 L2 缓存,可为 2D-FFT 和 DNN 等工作负载带来巨大的效益,并且分享了完整 Ponte Vecchio GPU 和 80 / 32 MB 模块之间的一些性能比较。

13.png

此外英特尔搬出了运行 CUDA 和 SYCL 的英伟达 Ampere A100,与使用 SYCL 的 Ponte Vecchio GPU 平台展开了性能横比。

14.png

在 miniBUDE(一种可预测配体与目标结合能的计算工作负载)中,Ponte Vecchio GPU 模拟测试结果的速度,更是 Ampere A100 的 2 倍。

15.png

另外在 ExaSMR 核反应堆设计仿真设计中,英特尔 Ponte Vecchio GPU 也以 1.5 倍领先于英伟达竞品方案。

16.png

不过需要指出的是,英伟达早已向市场投放了性能更加强悍的 Hopper H100,所以英特尔这里拿 Ampere A100 进行比较还是相当投机取巧的。

17.png

言归正传,英特尔概述了 Ponte Vecchio 旗舰数据中心 GPU 的一些关键特性,例如 128 个 Xe 内核、128 个光追(RT)单元、HBM2e 显存、以及连接到一起的 8 个 Xe-HPC GPU 。

21.png

该芯片在两个独立的堆栈中提供了高达 408 MB 的 L2 缓存、之间通过 EMIB 互连,且各部分芯片混用了 Intel 7 和台积电 N7 / N5 等多个工艺节点。

22.png

由两块(2 Tiles)组成的每个堆栈有 16 裸片,最大的 active die 尺寸为 41 m㎡、Compute Tile 则是 650 m㎡ 。

23.png

以下是 Ponte Vecchio GPU 的完整小芯片 / 工艺节点描述:

● 英特尔 7nm

● 台积电 7nm

● Foveros 3D 封装

● EMIB 互连

● 10nm 增强型 Super Fin

● Rambo Cache

● HBM2 高带宽显存

24.png

以下是英特尔 Ponte Vecchio 芯片的 47 块(Tiles)组成:

● 16 个 Xe HPC(内/外部)

● 8 个 Rambo Cache(内部)

● 2 个 Xe Base(内部)

● 11 个 EMIB(内部)

● 2 个 Xe Link(外部)

● 8 个 HBM(外部)

25.png

Ponte Vecchio GPU 使用了 8 个 HBM 8-Hi 堆栈,总共包含 11 个 EMIB 互连,完整封装尺寸为 4843.75 m㎡ 。

26.png

设计中还提到了高密度 3D Forveos 封装的 Meteor Lake CPU,可知其 bump pitch 的间距为 36u 。

27.png

【总结】Ponte Vecchio GPU 不是一个单独的芯片,而是由 47 个不同工艺制程的小芯片“组合”得来。

30.jpg

遗憾的是,受英特尔多次跳票的影响,使用 Ponte Vecchio GPU 和 Sapphire Rapids CPU 的 Aurora 超级计算机项目也被迫推迟。

即便如此,英特尔还是透露了下一代 Rialto Bridge GPU 。可知作为 Ponte Vecchio GPU 的继任者,其有望于 2023 年开始提供样品。

举报

  • 相关推荐
  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • iPhone Pocket被吐槽像保温水瓶套 网友:韭菜太好割

    苹果联合日本设计师品牌三宅一生推出iPhone Pocket配件,售价1299元。产品采用3D针织工艺,支持七种佩戴方式,但被质疑与普通手机套功能无异。社交媒体上“1299元买块会变形的布”引发热议,消费者对比9.9元帆布手机套直指苹果收割粉丝。支持者认为定价符合奢侈品逻辑,反对者则拒绝为设计概念支付溢价。该产品在设计价值与实用功能间引发两极争议。

  • iPhone Pocket正式开售:联名三宅一生 售价1299元起

    苹果与三宅一生合作推出iPhone Pocket配件,短带款1299元、长带款1899元。采用创新3D针织一体结构,适配所有iPhone型号,可容纳随身小物,拉伸时织物微透便于查看屏幕。支持手持、系包、佩戴等多种方式。虽被网友吐槽像“杯套”“长筒袜”,且定价偏高引发争议,但其独特设计和联名价值仍吸引关注。限量发售渠道有限,市场接受度待观察。

  • 苹果新配件iPhone Pocket 1299元起售

    苹果公司与三宅一生合作推出iPhone收纳包配件“iPhone Pocket”,11月14日正式发售。产品以“一块布”为设计灵感,采用3D针织一体结构,适配所有iPhone型号,可收纳钥匙、卡片等小物,支持手提、系包或贴身佩戴。短带款售价1299元(八色可选),长带款1899元(三色可选)。高定价引发争议:部分用户赞赏其设计独特性,认为联名值得购买;更多网友质疑性价比,称其为“智商税”。产品命名因与华为折叠屏手机“华为Pocket”相近,一度引发消费者误解,相关话题冲上热搜。

  • Creators’ App迎来重大更新

    索尼与分秒帧联合推出云端影像创作平台ICE-Cloud,集成索尼先进影像技术与高效云端协作能力,为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用,实现素材自动上传、云端管理、在线审片和项目协同,打破时空限制,提升创作效率。通过Creators’ App连接相机与云端,实现即拍即传、异地实时协作,致力于打造新一代创意工作流。

  • 1899元苹果手机包卖完了!iPhone Pocket在吐槽声中销售火爆

    今日,苹果与三宅一生(ISSEY MIYAKE)携手打造的全新配件iPhone Pocket正式登陆国内市场。尽管这款产品自曝光以来就因外观和价格饱受争议,被不少人吐槽“丑、贵”,但实际销售情况却出乎意料地火爆。 目前,苹果官网信息显示,售价1899元的长款iPhone Pocket已显示售罄。这一现象表明,即便外界评价褒贬不一,消费者对其的热情依旧高涨。

  • 苹果“一块布”卖1299元:iPhone Pocket数量有限 售完为止

    本周苹果推出了一款配件iPhone Pocket,短带款售价1299元,长带款售价1899元。 苹果官网底部小字显示,iPhone Pocket by ISSEY MIYAKE于Apple Store零售店和apple.com.cn有售,数量有限,售完为止。

  • 1299元起联名三宅一生!苹果iPhone Pocket开售 创始人曾为乔布斯设计经典毛衣

    今日,苹果与三宅一生(ISSEY MIYAKE)联合推出的全新配件iPhone Pocket正式开售,短带款售价1299元、长带款售价1899元。 中国大陆仅在上海Apple静安零售店和苹果官网有售,数量有限,售完为止。 据了解,iPhone Pocket基于苹果和三宅一生在设计理念上的相互尊重与共鸣,以一块布料”的构想为设计灵感,采用一体式3D 针织工艺,采用罗纹网状结构,承袭三宅一生获得专利的原创褶�

  • 1299元起售!iPhone Pocket发布:采用3D 针织一体结构

    今日下午,苹果发文称,三宅一生携手苹果正式推出新配件iPhone Pocket。 其中短带款提供八种色彩外观:柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。 长带款提供三种色彩外观:宝石蓝色、肉桂色和黑色。 短带款iPhone Pocket售价为1299元,长带款售价为1899元。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

今日大家都在搜的词: