英特尔SPR处理器配备64GB HBM2e、Ponte Vecchio拥有408MB L2缓存

2021-11-16 11:54 · 稿源： cnbeta

在一年一度的超算大会上，高性能计算行业的许多参与者都在积极讨论硬件、安装、以及设计等方面的最新进展。期间，芯片巨头英特尔也展示了自家的硬件，并披露了有关下一代 Aurora Exascale 超算的诸多细节。起初，Aurora 计划采用英特尔的 10nm 至强（Xeon）融核（Phi）平台，但随着技术的飞速发展，后续该项目也经历了多次推倒重来。

几年前最终敲定的方案，为 Aurora 选用了英特尔 Sapphire Rapids 处理器，特点是配备 HBM2e 高带宽缓存。以及 Ponte Vecchio 架构的 Xe-HPC GPU 加速器，可扩展数百 PetaFLOP 到 ExaFLOP 级别的算力。

早些时候，英特尔新任 CEO 帕特·基辛格透露，Ponte Vecchio 加速器实现了性能的翻番，可让建成后的 Aurora 成为一台“2+ EF”级别的超级计算机。

该公司预计将在 2022 年之前交付机器的其余部分，并于第一季度增加主流用户的硬件生产，以便在上半年有更广泛的发布。

处理器方面，Aurora 为每个单元都配备了两块 Sapphire Rapids CPU（简称 SPR）。其具有四个计算块、DDR5、PCIe 5.0、CXL 1.1（而不是 CXL.mem），并大量借用 EMIB 技术来实现连接。

至于自带的高带宽内存（HBM），可知英特尔为该系列 SPR 处理器选用了 8-Hi 堆栈，以提供高达 64GB 的 HBM2e 内存。（据说英特尔打算使用四个 16GB HBM2e 堆栈来组成 64GB 内存）

考虑到英特尔与美光之间的特殊关系，我们发现 Micron HBM2e 的物理尺寸，正巧与 Intel 材料中给出的标示一致（而不是三星或 SK 海力士）。

当前美光提供了两种带有硬件 ECC 的 16GB HBM2e 产品，一种为每引脚 2.8 Gbps（每堆栈 358 GB/s）、另一种为每引脚 3.2 Gbps（每堆栈 410 GB/s）。

取决于英特尔使用的版本，其峰值总带宽可介于 1.432 ~ 1.64 TB/s 之间。不过 SPR HBM 版本还会额外使用四个 Tile，并将每个 HBM 堆栈连接到一个小芯片。

由图可知，尽管 Intel 表示 SPR+HBM 版本与普通 SPR SKU 共享插槽，但明显还是存在不兼容的地方。这也能是一个实例，即 Aurora 超算上使用了专门的调整设计。

至于 Ponte Vecchio（Xe HPC 2-Tile / PVC），英特尔披露单个 Aurora 服务器里的每两块 SPR 处理器，将搭配六块 PVC 加速器。

每个加速器都将使用内置的新 Xe-Link 全拓扑互连协议，尽管全连接模式下支持 8 路，但 Aurora 还是相对节制了一下。

尽管英特尔尚未披露 PVC 是如何与 SPR 处理器连接的，但至少 CPU / GPU 之间采用了统一内存架构设计。

英特尔补充道，每个 Ponte Vecchio 双栈部署将具有总共 64 MB 的 L1 缓存和 408 MB 的 L2 缓存（每个堆栈具有 204 MB L2），并由 HBM2e 提供支持。

作为比较，英伟达 A100 方案具有 40MB L2 缓存、AMD Navi 21 配备了 128MB 无限缓存（Infinity Cache / 有效 L3）。

至于 AMD 为 Frontier 超算提供的 CDNA2 MI250X 加速卡，则配备了每堆栈 8MB L2 缓存（总共 16MB）。

（图 via AnandTech）

无论采用何种方式进行切片，英特尔都在努力为 PVC 提供正确的缓存层次结构。由图表的 4 个 HBM2e 芯片设计来看，每个 PVC 双堆栈或具有高达 128GB 的 HBM2e 内存。

更重要的是，我们还正式获悉 Aurora 将用到多少块 Ponte Vecchio GPU 加速卡和 Sapphire Rapids（+HBM）处理器。

早在 2019 年 11 月，当 Aurora 还仅规划了 1 EF 算力时，就有基于 200 个机架布局的猜想 —— 简单换算是 5000 颗 CPU + 15000 块 GPU 加速卡，且每个 PVC 大约 66.6 TF 性能。

当时英特尔在早期芯片上展示了每张卡 40 TF 的性能，而 Aurora 2 EF 的官方参数则是 54000+ GPU / 18000+ CPU，意味每个 PVC 仅 37 TeraFlops（完全未将 CPU 性能算进去的话）。

至于 PVC 的功率，可参考额定功率为 60 MW 的 FP64 Vector（2 ExaFlops），那样系统为每张卡分配的功率或为 1053 W 。若 Frontier 与 Aurora 的开销类似，预计每个 PVC 的功率在 615 W。

最终 37 TF 的 PVC 功率为 615 W，而 MI250X 的 47.9 FP 功率仅为 560 W 。不过这里并未深入每张卡的原始性能，及其在特定用例中的特定功能

（举报）

相关推荐

关键词：

荐双11“换芯” 阿里妈妈AI按下加速键

今年双11的不同，在平台对外披露的商家案例中得以一窥究竟。 AI智能选品、AI智能出价、AI智能调控投放节奏..... 这些营销策略的表述来自音箱品牌Marshall，双11第一波段10天活动期内，Marshall在影音电器行业品牌和店铺排名均位居第一;成交转化率提升67%，爆款成交同比增长30%。这波爆发式增长的背后，反复被CUE到的AI可以说是深藏功与名。绝非只是平台意志的表达，

AI智能选品 AI智能出价 AI智能调控
古怪加速器两周年永久时长卡免费送错过手慢无

古古怪怪加速器迎来两周年庆，推出超值福利：全场套餐最低六折起，买一送一更划算。参与活动可抽永久时长卡，最高得500小时SVIP。加速器每日免费16小时可暂停，拥有海量海外节点，内置掉线保护、多线切换等功能，解决游戏卡顿延迟问题。内置帧数大师等工具提升游戏流畅度，搭配AI优化降低电脑温度。现在打开即可领20小时免费时长，机不可失！

文章搜索核心标签内容检索
荐短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
荐边看边买？红果内测“搜同款”，加速短剧电商变现

短剧还能带货? 近日，红果短剧被曝内测短剧带货功能。用户在红果观看短剧时，暂停观看时会弹出“搜同款”提示，点击后页面显示商品链接。用户无需跳转抖音，在红果站内便可直接完成购买。这一功能目前已覆盖红果上几乎所有短剧，包括《盛夏芬德拉》《好一个乖乖女》《家里家外》等新老剧集。加入电商功能，意味着红果的变现路径再度拓宽;另一方面，

短剧带货红果短剧电商功能
科普 | 读懂HBM和DRAM，才懂AI算力未来

在AI算力需求激增的背景下，存储芯片成为决定计算性能的关键。文章重点分析了三大易失性存储技术：SRAM凭借高速读写特性在CPU缓存中不可替代；DRAM作为数字世界的“主内存”，在容量与速度间实现平衡；HBM则通过3D堆叠架构革命性提升带宽，突破AI训练中的“内存墙”瓶颈。当前HBM需求爆发式增长，预计2025年市场规模将达340亿美元。中国企业在DRAM领域逐步突破，并开始布局HBM技术，正通过持续技术积累提升在全球半导体生态中的地位。

存储芯片 DRAM HBM
每日互动方毅：以“标品-标类-标杆”三级推进，加速AI战略落地

每日互动在创业20周年之际举办AI共创会，强调以数据智能为根基，通过“端详”方法论实现从数据到智慧的积累。公司推出个知·智能工作站，结合AI能力与专家经验，推动人机协同。战略上分“标品、标类、标杆”三层：标品打造通用工具，标类深耕垂直行业，标杆联合龙头企业共创解决方案。方毅提出“尽信AI不如无AI”，坚持人类在决策中的关键作用，并创造汉字“伭”作为AI简称，寄望人机共生未来。

AI共创会数据智能个知·智能工作站
技嘉发布X3D系列主板：专为AMD X3D处理器打造，游戏性能提升高达25%

技嘉推出专为AMD Ryzen X3D处理器优化的X870E AORUS X3D系列主板，首发型号包括MASTER与PRO两款。该系列搭载X3D鸡血模式2.0技术，通过AI智能场景识别可自动优化处理器性能，游戏性能最高提升25%。主板采用全快易拆设计，配备免螺丝M.2插槽、磁吸散热装甲及一键拆卸显卡插槽。集成AI黑科技2.0支持DDR5内存超频至9000MT/s+，预装网卡驱动实现开机即联网。两款主板均提供4年质保（含1年免费换新），现已在各大电商平台上市。

技嘉主板 AMD Ryzen
2025视觉中国&500px视觉盛典青岛站开启招募！

本文介绍了多个科技品牌在展会现场推出的互动体验和福利活动：至誉科技提供免费笔记本屏幕校色服务，关注小红书可领取贴纸等礼品；东芝通过问卷赠送手机挂绳；索尼展出新品相机镜头；适马打卡送周边；永诺展示神秘新品镜头；雷克沙关注社媒可领专属礼物；富图宝有识脚架互动游戏；神牛到场即送周边；艺卓体验专业显示器；唯卓仕可参与新品抽奖；斯丹德提供免费抽奖与补光灯体验；明基首次展出未发售的校色显示器。各品牌均通过现场互动吸引用户参与。

展位活动免费校色问卷赢礼
费率三连降、净利率三连升！海尔智家变革加速

海尔智家10月30日发布超预期三季报，营收利润再创新高。关键看点：一是费用率三连降，数字化改革显效；二是净利率三连升，在全球市场承压下实现中长期稳健增长。增长逻辑在于“三板斧”策略：打造爆款产品（如懒人洗系列）、推进全流程数字化变革降本增效、深化全球化本土运营（如北美强化供应链、欧洲精准推高端产品）。通过技术质量优化与模式升级，公司持续穿越周期，展现强劲增长潜力。

海尔智家三季报数字化变革
荐前B站副总裁打造“非共识”AI陪伴，国内拿下千万用户后加速出海

在今年东京电玩展的现场，我们第一次见到了 AI 陪伴创企心影随形的创始人刘斌新。面前的刘斌新，像此前媒体同行描述的一样随和、健谈，他曾先后出任过百度副总监、360助理总裁、B 站副总裁，2023年，他选择了自己创业，从熟悉的游戏场景切入做一款 AI 陪伴产品，「逗逗游戏伙伴」由此诞生。从整个 AI 陪伴品类来看，「逗逗游戏伙伴」是一个很“特别”的存在。不同�

AI陪伴游戏伙伴东京电玩展

今日大家都在搜的词：

热文

3 天
7天

英特尔SPR处理器配备64GB HBM2e、Ponte Vecchio拥有408MB L2缓存

荐双11“换芯” 阿里妈妈AI按下加速键

古怪加速器两周年永久时长卡免费送错过手慢无

荐短视频加速跑入AI时代

荐边看边买？红果内测“搜同款”，加速短剧电商变现

科普 | 读懂HBM和DRAM，才懂AI算力未来

每日互动方毅：以“标品-标类-标杆”三级推进，加速AI战略落地

技嘉发布X3D系列主板：专为AMD X3D处理器打造，游戏性能提升高达25%

2025视觉中国&500px视觉盛典青岛站开启招募！

费率三连降、净利率三连升！海尔智家变革加速

荐前B站副总裁打造“非共识”AI陪伴，国内拿下千万用户后加速出海

今日大家都在搜的词：

热文

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

鸿蒙智行：智界R7累计交付量破10万台

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发