首页 > 业界 > 关键词  > 英特尔最新资讯  > 正文

英特尔SPR处理器配备64GB HBM2e、Ponte Vecchio拥有408MB L2缓存

2021-11-16 11:54 · 稿源: cnbeta

在一年一度的超算大会上,高性能计算行业的许多参与者都在积极讨论硬件、安装、以及设计等方面的最新进展。期间,芯片巨头英特尔也展示了自家的硬件,并披露了有关下一代 Aurora Exascale 超算的诸多细节。起初,Aurora 计划采用英特尔的 10nm 至强(Xeon)融核(Phi)平台,但随着技术的飞速发展,后续该项目也经历了多次推倒重来。

几年前最终敲定的方案,为 Aurora 选用了英特尔 Sapphire Rapids 处理器,特点是配备 HBM2e 高带宽缓存。以及 Ponte Vecchio 架构的 Xe-HPC GPU 加速器,可扩展数百 PetaFLOP 到 ExaFLOP 级别的算力。

早些时候,英特尔新任 CEO 帕特·基辛格透露,Ponte Vecchio 加速器实现了性能的翻番,可让建成后的 Aurora 成为一台“2+ EF”级别的超级计算机。

该公司预计将在 2022 年之前交付机器的其余部分,并于第一季度增加主流用户的硬件生产,以便在上半年有更广泛的发布。

处理器方面,Aurora 为每个单元都配备了两块 Sapphire Rapids CPU(简称 SPR)。其具有四个计算块、DDR5、PCIe 5.0、CXL 1.1(而不是 CXL.mem),并大量借用 EMIB 技术来实现连接。

至于自带的高带宽内存(HBM),可知英特尔为该系列 SPR 处理器选用了 8-Hi 堆栈,以提供高达 64GB 的 HBM2e 内存。(据说英特尔打算使用四个 16GB HBM2e 堆栈来组成 64GB 内存)

考虑到英特尔与美光之间的特殊关系,我们发现 Micron HBM2e 的物理尺寸,正巧与 Intel 材料中给出的标示一致(而不是三星或 SK 海力士)。

当前美光提供了两种带有硬件 ECC 的 16GB HBM2e 产品,一种为每引脚 2.8 Gbps(每堆栈 358 GB/s)、另一种为每引脚 3.2 Gbps(每堆栈 410 GB/s)。

取决于英特尔使用的版本,其峰值总带宽可介于 1.432 ~ 1.64 TB/s 之间。不过 SPR HBM 版本还会额外使用四个 Tile,并将每个 HBM 堆栈连接到一个小芯片。

由图可知,尽管 Intel 表示 SPR+HBM 版本与普通 SPR SKU 共享插槽,但明显还是存在不兼容的地方。这也能是一个实例,即 Aurora 超算上使用了专门的调整设计。

至于 Ponte Vecchio(Xe HPC 2-Tile / PVC),英特尔披露单个 Aurora 服务器里的每两块 SPR 处理器,将搭配六块 PVC 加速器。

每个加速器都将使用内置的新 Xe-Link 全拓扑互连协议,尽管全连接模式下支持 8 路,但 Aurora 还是相对节制了一下。

尽管英特尔尚未披露 PVC 是如何与 SPR 处理器连接的,但至少 CPU / GPU 之间采用了统一内存架构设计。

英特尔补充道,每个 Ponte Vecchio 双栈部署将具有总共 64 MB 的 L1 缓存和 408 MB 的 L2 缓存(每个堆栈具有 204 MB L2),并由 HBM2e 提供支持。

作为比较,英伟达 A100 方案具有 40MB L2 缓存、AMD Navi 21 配备了 128MB 无限缓存(Infinity Cache / 有效 L3)。

至于 AMD 为 Frontier 超算提供的 CDNA2 MI250X 加速卡,则配备了每堆栈 8MB L2 缓存(总共 16MB)。

(图 via AnandTech)

无论采用何种方式进行切片,英特尔都在努力为 PVC 提供正确的缓存层次结构。由图表的 4 个 HBM2e 芯片设计来看,每个 PVC 双堆栈或具有高达 128GB 的 HBM2e 内存。

更重要的是,我们还正式获悉 Aurora 将用到多少块 Ponte Vecchio GPU 加速卡和 Sapphire Rapids(+HBM)处理器。

早在 2019 年 11 月,当 Aurora 还仅规划了 1 EF 算力时,就有基于 200 个机架布局的猜想 —— 简单换算是 5000 颗 CPU + 15000 块 GPU 加速卡,且每个 PVC 大约 66.6 TF 性能。

当时英特尔在早期芯片上展示了每张卡 40 TF 的性能,而 Aurora 2 EF 的官方参数则是 54000+ GPU / 18000+ CPU,意味每个 PVC 仅 37 TeraFlops(完全未将 CPU 性能算进去的话)。

至于 PVC 的功率,可参考额定功率为 60 MW 的 FP64 Vector(2 ExaFlops),那样系统为每张卡分配的功率或为 1053 W 。若 Frontier 与 Aurora 的开销类似,预计每个 PVC 的功率在 615 W。

最终 37 TF 的 PVC 功率为 615 W,而 MI250X 的 47.9 FP 功率仅为 560 W 。不过这里并未深入每张卡的原始性能,及其在特定用例中的特定功能

举报

  • 相关推荐
  • 英特尔联动「扣子 AI 工坊」启动高校计划——让校园创意一键开挂

    英特尔与新一代AI平台扣子联合发起“英特尔×扣子AI工坊高校计划”,旨在通过校企合作推动AI技术在教育领域的深度融合。该计划以校园场景化实践为核心,通过线下工作坊、创新挑战赛等形式,将前沿AI工具引入高校,帮助学生掌握AI应用能力。活动覆盖全国数百所高校,结合酷睿Ultra处理器的硬件优势,让学生直观体验AI在创作、学习等场景的高效赋能。未来双方计划深化课程共建与就业对接,构建AI教育新生态,助力青年适应智能时代发展需求。

  • 迅雷游戏加速器率先上线《无主之地4》“小地图导航”功能

    《无主之地4》取消小地图设计导致玩家频繁迷路,严重影响游戏体验。迅雷游戏加速器推出"小地图导航"功能,提供实时悬浮地图、精准定位和方向指引,让玩家无需频繁打开大地图即可高效寻路。该功能还支持物品收集和联机优化,提升游戏流畅度。同时推出抽奖活动,100%保底获得游戏本体及官方周边。

  • 购机选Intel还是AMD?终结选择困难!不同场景对比避坑攻略

    文章对比了英特尔酷睿Ultra 5 225H与AMD锐龙AI 9 H365处理器在大学生学习场景中的表现。测试显示,英特尔在续航和AI创作效率方面优势明显:图书馆场景下续航多50%,视频剪辑等AI任务处理速度快40%,且价格更低。结论指出,酷睿Ultra平台更适合需要长续航、高效AI应用且注重性价比的学生群体,是大学四年的明智选择。

  • 青云租携手国资基金5亿入局,RWA通证化加速落地

    2025年8月27日,深圳爱高科创与深圳国英潜丰签署战略合作协议,国资金融基金5亿元投资青云租平台。资金将专项用于3C数码免押租赁业务拓展及RWA(实物资产通证化)项目。合作核心在于将青云租的免押租赁模式与区块链技术结合,实现租赁订单、应收账款等资产通证化,提升流动性和透明度。此举将推动资产证券化、跨境融资与港股市场拓展,加速中国数字租赁产业升级,展示行业硬核力量。

  • 霸榜双雄齐步走!Century Games专列直达东京电玩展

    世纪华通旗下Century Games为参加2025东京电玩展(TGS2025)量身定制了游戏主题“专列”,覆盖地铁广告、户外展示、裸眼3D大屏等多元传播渠道。9月25日至28日展会期间,公司包下途经展馆的列车广告位,车厢内贴满《Whiteout Survival》与《Kingshot》海报,串联涩谷、浅草寺等人流密集站点。展馆外设置巨型玻璃钢装置,以两款游戏标志性场景为背景,结合本地化舞台节目与互动体验,强化品牌影响力。此次营销不仅为展会预热,更彰显公司深耕日本市场、以“场景化+本地化”策略提升用户粘性的决心。

  • 三星正式向更多Galaxy设备推送Samsung One UI 8更新

    三星电子正式推送One UI 8更新,为Galaxy用户带来增强的多模态AI功能,包括个性化建议、实时窗口、即时简报等智能体验。新系统优化了不同设备形态的交互,结合Knox安全架构保护隐私,并支持实时翻译、游戏辅助等实用工具。9月18日起中国用户可优先升级,年底前将扩展至更多机型。

  • 卡萨帝自研AI动态五恒空气系统加速大暖通布局

    卡萨帝在高端暖通市场推出行业唯一全自研AI动态五恒空气系统,通过AI驱动实现恒温、恒湿、恒氧、恒净、恒静五大维度舒适体验。该系统采用隐形设计,精准控制全屋温度波动在0.5℃以内,自动匹配南北气候差异,并通过新风多层净化打造森林级洁净环境。依托全链路自研能力,卡萨帝打破传统品类边界,构建“方案+全周期服务”一体化高端生态系统,推动行业从单品竞争向生态整合升级。数据显示其高端方案类产品销量同比增长120%,品牌收入提升超50%,持续强化在大暖通赛道的高端引领地位。

  • 海尔智家数字化变革再加速:SKU效率提升15%

    海尔智家2025年上半年业绩超预期,8月线上线下市场份额双第一。增长动力来自数字化战略转型,通过“听劝”系统连接用户需求与全球资源,实现从制造到共创的跨越。爆款产品频出:Leader三筒洗衣机交付10万台,卡萨帝冰箱高端市场份额超50%,净省电空调销量破110万套。多品牌协同覆盖不同群体,带动整体增长,上半年零售额同比增长18%。持续推动AI与数字化变革,促进行业升级。

  • Matrixport 加密基金获 FCA 营销许可,机构化投资通道加速成型

    2025年9月11日,Matrixport旗下旗舰产品Crypto Market Index Fund获得英国FCA营销许可,成为首个可在英国向专业投资者私募销售的瑞士加密基金。该基金追踪瑞士SIX交易所的CMI10指数,覆盖BTC、ETH等十大主流加密资产,采用合规基金结构,由FINMA监管。此次突破体现了Matrixport"双轮驱动"战略:持续优化产品结构与深化合规运营,为机构提供透明安全的数字资产配置工具。

  • IFA国际展会中国品牌增长超80%,海外红人营销加速出海

    2025年柏林国际消费电子展(IFA)聚焦“智能生活·可持续未来”,吸引全球近2000家展商参与。中国参展企业达764家,创历史新高,展现从“中国制造”向“中国智造”的转型。AI技术成为创新核心,海尔、海信等企业推出智能家电解决方案,覆盖显示技术、绿色科技等领域。中国企业通过体育IP合作、本地化运营深化全球布局,摆脱代工模式,以技术、品牌和生态为核心重塑国际竞争力。

今日大家都在搜的词: