英特尔详细介绍Ponte Vecchio 性能可达英伟达A100平台的2.5倍

2022-08-23 09:15 · 稿源： cnbeta

在 Hot Chips 34 大会期间，英特尔再次详细介绍了 Sapphire Rapids HBM 处理器 + Ponte Vecchio（2-Stack）GPU 平台的潜力，称该服务器平台的性能可达英伟达 A100 竞品的 2.5 倍。英特尔首席 GPU 计算架构师 Hong Jiang 在演讲中指出，Ponte Vecchio 具有三种配置。

从单一 OAM、到配备 Xe Links 的 x4 子系统，Ponte Vecchio GPU 不仅能够单独运行、也可部署于 Sapphire Rapids 双路服务器平台之上。

其中 OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑，辅以英特尔 oneAPI 软件堆栈。

作为一个零级（Level Zero）API，其为跨架构编程支持提供了低层级的硬件接口。

oneAPI 主要特性如下：

● 提供面向其它工具和加速器设备的接口；

● 支持精细的增益控制、以及低延迟的加速器特性；

● 具有多线程设计；

● 将 GPU 作为驱动程序的一部分而提供。

性能指标方面，2-Stack Ponte Vecchio GPU 配置（如单一 OAM 上的配置），可提供高达 52 TFLOP 的 FP64 / FP32 算力。

另有 419 TFLOP 的 TF32（XMX Float 32）、839 TFLOP 的 BF16 / FP16，以及 1678 TFLOPs 的 INT8 算力。

英特尔还详细说明了 Ponte Vecchio 的缓存大小 / 峰值带宽 —— 比如 GPU 上的寄存器为 64 MB，提供 419 TB/s 的带宽。

L1 缓存也为 64 MB，带宽 105 TB/s（4:1）。L2 缓存为 408 MB，带宽 13 TB/s（8:1）。HBM 内存池高达 128 GB，辅以 4.2 TB/s（4:1）的带宽。

以下是英特尔为 Ponte Vecchio 配备的系列计算效率（compute efficiency）技术。

Register File（寄存器文件）：

● Register Caching（寄存器缓存）

● Accumulators（累加器）

L1 / L2 Cache：

● Write Through（直写）

● Write Back（回写）

● Write Streaming（流式写入）

● Uncached（不缓存）

Prefetch（预取）：

● 支持 L1 和（或）L2 缓存的软件（指令）预取；

● 支持到 L2 获取指令和数据的 Command Streamer 预取。

英特尔解释称，更大的 L2 缓存，可为 2D-FFT 和 DNN 等工作负载带来巨大的效益，并且分享了完整 Ponte Vecchio GPU 和 80 / 32 MB 模块之间的一些性能比较。

此外英特尔搬出了运行 CUDA 和 SYCL 的英伟达 Ampere A100，与使用 SYCL 的 Ponte Vecchio GPU 平台展开了性能横比。

在 miniBUDE（一种可预测配体与目标结合能的计算工作负载）中，Ponte Vecchio GPU 模拟测试结果的速度，更是 Ampere A100 的 2 倍。

另外在 ExaSMR 核反应堆设计仿真设计中，英特尔 Ponte Vecchio GPU 也以 1.5 倍领先于英伟达竞品方案。

不过需要指出的是，英伟达早已向市场投放了性能更加强悍的 Hopper H100，所以英特尔这里拿 Ampere A100 进行比较还是相当投机取巧的。

言归正传，英特尔概述了 Ponte Vecchio 旗舰数据中心 GPU 的一些关键特性，例如 128 个 Xe 内核、128 个光追（RT）单元、HBM2e 显存、以及连接到一起的 8 个 Xe-HPC GPU 。

该芯片在两个独立的堆栈中提供了高达 408 MB 的 L2 缓存、之间通过 EMIB 互连，且各部分芯片混用了 Intel 7 和台积电 N7 / N5 等多个工艺节点。

由两块（2 Tiles）组成的每个堆栈有 16 裸片，最大的 active die 尺寸为 41 m㎡、Compute Tile 则是 650 m㎡。

以下是 Ponte Vecchio GPU 的完整小芯片 / 工艺节点描述：

● 英特尔 7nm

● 台积电 7nm

● Foveros 3D 封装

● EMIB 互连

● 10nm 增强型 Super Fin

● Rambo Cache

● HBM2 高带宽显存

以下是英特尔 Ponte Vecchio 芯片的 47 块（Tiles）组成：

● 16 个 Xe HPC（内/外部）

● 8 个 Rambo Cache（内部）

● 2 个 Xe Base（内部）

● 11 个 EMIB（内部）

● 2 个 Xe Link（外部）

● 8 个 HBM（外部）

Ponte Vecchio GPU 使用了 8 个 HBM 8-Hi 堆栈，总共包含 11 个 EMIB 互连，完整封装尺寸为 4843.75 m㎡。

设计中还提到了高密度 3D Forveos 封装的 Meteor Lake CPU，可知其 bump pitch 的间距为 36u 。

【总结】Ponte Vecchio GPU 不是一个单独的芯片，而是由 47 个不同工艺制程的小芯片“组合”得来。

遗憾的是，受英特尔多次跳票的影响，使用 Ponte Vecchio GPU 和 Sapphire Rapids CPU 的 Aurora 超级计算机项目也被迫推迟。

即便如此，英特尔还是透露了下一代 Rialto Bridge GPU 。可知作为 Ponte Vecchio GPU 的继任者，其有望于 2023 年开始提供样品。

（举报）

相关推荐

关键词：

荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

苹果联合日本设计师品牌三宅一生推出iPhone Pocket配件，售价1299元。产品采用3D针织工艺，支持七种佩戴方式，但被质疑与普通手机套功能无异。社交媒体上“1299元买块会变形的布”引发热议，消费者对比9.9元帆布手机套直指苹果收割粉丝。支持者认为定价符合奢侈品逻辑，反对者则拒绝为设计概念支付溢价。该产品在设计价值与实用功能间引发两极争议。
iPhone Pocket正式开售：联名三宅一生售价1299元起

苹果与三宅一生合作推出iPhone Pocket配件，短带款1299元、长带款1899元。采用创新3D针织一体结构，适配所有iPhone型号，可容纳随身小物，拉伸时织物微透便于查看屏幕。支持手持、系包、佩戴等多种方式。虽被网友吐槽像“杯套”“长筒袜”，且定价偏高引发争议，但其独特设计和联名价值仍吸引关注。限量发售渠道有限，市场接受度待观察。

苹果三宅一生 iPhone
苹果新配件iPhone Pocket 1299元起售

苹果公司与三宅一生合作推出iPhone收纳包配件“iPhone Pocket”，11月14日正式发售。产品以“一块布”为设计灵感，采用3D针织一体结构，适配所有iPhone型号，可收纳钥匙、卡片等小物，支持手提、系包或贴身佩戴。短带款售价1299元（八色可选），长带款1899元（三色可选）。高定价引发争议：部分用户赞赏其设计独特性，认为联名值得购买；更多网友质疑性价比，称其为“智商税”。产品命名因与华为折叠屏手机“华为Pocket”相近，一度引发消费者误解，相关话题冲上热搜。

苹果三宅一生 iPhone
Creators’ App迎来重大更新

索尼与分秒帧联合推出云端影像创作平台ICE-Cloud，集成索尼先进影像技术与高效云端协作能力，为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用，实现素材自动上传、云端管理、在线审片和项目协同，打破时空限制，提升创作效率。通过Creators’ App连接相机与云端，实现即拍即传、异地实时协作，致力于打造新一代创意工作流。

索尼云端影像创作平台 Creators’
1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

今日，苹果与三宅一生（ISSEY MIYAKE）携手打造的全新配件iPhone Pocket正式登陆国内市场。尽管这款产品自曝光以来就因外观和价格饱受争议，被不少人吐槽“丑、贵”，但实际销售情况却出乎意料地火爆。目前，苹果官网信息显示，售价1899元的长款iPhone Pocket已显示售罄。这一现象表明，即便外界评价褒贬不一，消费者对其的热情依旧高涨。

苹果三宅一生 iPhone
苹果“一块布”卖1299元：iPhone Pocket数量有限售完为止

本周苹果推出了一款配件iPhone Pocket，短带款售价1299元，长带款售价1899元。苹果官网底部小字显示，iPhone Pocket by ISSEY MIYAKE于Apple Store零售店和apple.com.cn有售，数量有限，售完为止。

iPhone Pocket 苹果配件
1299元起联名三宅一生！苹果iPhone Pocket开售创始人曾为乔布斯设计经典毛衣

今日，苹果与三宅一生（ISSEY MIYAKE）联合推出的全新配件iPhone Pocket正式开售，短带款售价1299元、长带款售价1899元。中国大陆仅在上海Apple静安零售店和苹果官网有售，数量有限，售完为止。据了解，iPhone Pocket基于苹果和三宅一生在设计理念上的相互尊重与共鸣，以一块布料”的构想为设计灵感，采用一体式3D 针织工艺，采用罗纹网状结构，承袭三宅一生获得专利的原创褶�

苹果联名 iPhone Pocket
1299元起售！iPhone Pocket发布：采用3D 针织一体结构

今日下午，苹果发文称，三宅一生携手苹果正式推出新配件iPhone Pocket。其中短带款提供八种色彩外观：柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。长带款提供三种色彩外观：宝石蓝色、肉桂色和黑色。短带款iPhone Pocket售价为1299元，长带款售价为1899元。

苹果 iPhone Pocket
品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

今日大家都在搜的词：

热文

3 天
7天

英特尔详细介绍Ponte Vecchio 性能可达英伟达A100平台的2.5倍

荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

iPhone Pocket正式开售：联名三宅一生售价1299元起

苹果新配件iPhone Pocket 1299元起售

Creators’ App迎来重大更新

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

苹果“一块布”卖1299元：iPhone Pocket数量有限售完为止

1299元起联名三宅一生！苹果iPhone Pocket开售创始人曾为乔布斯设计经典毛衣

1299元起售！iPhone Pocket发布：采用3D 针织一体结构

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

今日大家都在搜的词：

热文

iPhone Pocket正式开售：联名三宅一生售价1299元起

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

站长商机