首页 > 业界 > 关键词  > arm最新资讯  > 正文

Marvell宣布OCTEON 10 DPU平台:采用ARM N2 CPU内核与5nm制程

2021-06-29 13:55 · 稿源: cnbeta

一年多前,我们就已经听说过美满电子(Marvell)的 OCTEON TX2 基础架构处理器。自那时起,相关生态就一直在公司内外以极快的方式在发展。今天我们要介绍的,就是 Marvell 最新推出的 OCTEON 10 系列 DPU 。作为一个全新的 SoC 系列,其采用了台积电 5nm 制程工艺,且首次用上了 ARM 的 Neoverse N2 CPU 内核。

0.png

上一代的 OCTEON TX 和 OCTEON TX2,仅被 Marvel 称作“基础架构处理器”。而最新的 OCTEON 10 平台,则被该公司称作 DPU 加速器。这种类型的多功能芯片,旨在帮助移动和处理那些通过网络传输的数据。

1.png

在 OCTEON 10 身上,我们不仅看到了与上一代相同的多功能构建块阵列,还看到了某些先进的 IP、以及一些新功能。比如集成机器学习推理的引擎、内联加密处理器、以及矢量数据包处理器,且它们都能够以虚拟化方式运行。

2.png

值得一提的是,OCTEON 10 也是 Marvell 首款采用台积电 N5P 工艺制造的 DPU 芯片。其不仅率先集成了 ARM 的 Neoverse N2 CPU 核心,还支持最新的 PCIe 5.0 I/O 与 DDR5 内存。

作为 DPU 的重要补充,Marvell 还为 OCTEON 10 引入了内部机器学习(ML)引擎。尽管去年完成的早期 IP,最初是为专用型的推理加速应用而打造的。

但在激烈的市场竞争面前,该公司还是决定暂时按下不表,直到将 ML 加速器集成到最新的 OCTEON DPU 芯片中。

3.png

Marvel 指出,将推理加速器放到同一芯片、并直接集成到数据管道中,对于此类数据流用例所需的高吞吐量 / 低延迟处理至关重要。

与此同时,Marvel 正在为英伟达下一代 BlueField-3 DPU 提供优于竞争对手的解决方案,尤其在 AI 处理性能和产能等方面。

据悉,首批 OCTEON 10 产品预计将于 2021 年底前出样,而英伟达 BF2 则要等到 2022 年。

4.png

此外 OCTEON 10 新系列引入了矢量数据包处理引擎,与当前一代的标量处理引擎相比,它能够将数据包的处理吞吐量,大幅提升至 5 倍。

如前所述,OCTEON 10 DPU 系列是首款公开宣布采用 ARM 最新的 Neoverse N2 基础架构的 CPU IP 设计。

AnandTech 在数月前介绍过 N2 与面向高性能计算的 HPC V1,可知与亚马逊 Graviton2 或 Ampere Altra 相比,其承诺带来 40% 的性能提升。

5.png

对于 Marvell 而言,在从 TX CPU 核心切换到 N2 之后,其单线程性能亦有望提升 3 倍。2020 年底的时候,该公司已宣布停用自家的 CPU IP,转而支持 ARM 的 Neoverse 内核。

从 DPU 用例来看,这款 Armv9 CPU 也支持 SVE2,其中包含了有利于数据处理和机器学习功能的重要指令,这点较英伟达 BlueField3 DPU 设计具有很大的优势(后者仍停留在 Armv8.2+ 的 Cortex-A78 内核)。

6.png

Marvel 还为 N2 配备了完整的缓存选项,包括 64KB L1I 和 L1D 缓存,以及完整的 1MB L2 缓存。不过在网状网络解决方案上,Marvell 还是选择了为该 SoC 集成自家的设计。

这部分的规格相当高,网状网络中提供了 256-bit 数据路径,辅以 2MB 的 L3 共享缓存,并且能够随着核心数量的增加而加大。

7.png

在交换集成和网络吞吐量方面,Marvell 结合了 1 Tbps 交换与多达 16 路 50G MAC 整合到了一起,尽管实际产品 SKU 还是会针对特定场景而有所区分。

AnandTech 指出,OCTEON 10 系列涵盖了广泛的应用,从 4G / 5G RAN 数字 / 中央单元、到前传网关vRAN 卸载处理器等。

在云和数据中心用例上,这些解决方案可在计算与网络吞吐量性能方面,提供广泛的多功能性。对于企业而言,OCTEON 10 系列亦可提供深度集成的数据包处理和安全加速特性。

8.png

首个 OCTEON 10 产品将基于 CN106XX 设计,在 PCIe 5.0 外形尺寸上提供了 24 个 N2 内核 + 双路 100GbE QSFP56 端口,

目前 CN106XX 已经完成流片,预计将于 2021 下半年出样,且有望在 4 季度上市。规格方面,Marvell 对 OCTEON 10 系列的各种设计进行了细分。

比如本文介绍的 DDR5 控制器特指 40-bit 通道(含 8-bit ECC),辅以 SPECint2006 基准测试的性能参考数据。

9.png

此外 Marvell 准备了另外三款 OCTEON 10 SKU,包括仅配备 8 个 N2 内核、TDP 低至 10-25W 的入门级 CN103XX,两款改进网络连接的高端款 CN106XXS,以及多达 32 个 N2 内核、运算能力和网络连接吞吐量都最高的旗舰级 DPU400 。

好消息是,即便是规格最强的产品,其热设计功耗也只有 60W,远低于当前一代 CN98XX Octeon TX2 旗舰 SKU 的 80-120W。不过这些产品尚未流片,预计出样时间为 2022 年。

Marvell 总结道,该公司在 DPU 出货量方面一直处于行业领先地位,且在所有大型数据中心都有广泛的部署。随着全新一代 OCTEON 10 系列产品的到来,其将在性能和效率方面拥有更显著的竞争优势。

  • 相关推荐
  • 大家在看
  • 消息人士:欧盟将对英伟达收购Arm交易进行反垄断调查

    据国外媒体报道,虽然英伟达在上周提交给欧盟的文件中,对收购Arm的交易做出了让步,但消息人士透露英伟达的让步并未缓解欧盟对这一收购交易在竞争方面的担忧,欧盟将对这一收购交易进行反垄断调查。

  • 英伟达收购ARM交易或以失败告终 欧盟将对交易展开全面调查

    据路透社报道,英伟达收购ARM的交易最终或以失败告终, 因为该交易获得监管部门批准的可能性越来越小。欧盟反垄断监管机构将对这笔交易展开全面调查。

  • 科技早报|苹果19日举行Mac发布会 英伟达收购ARM希望渺茫

    凤凰网科技讯 北京时间10月13日消息,昨夜今晨,科技圈都发生了哪些故事,以下是要闻回顾:先看苹果:苹果将于10月19日举行发布会 MacBook Pro五年首次大改苹果公司今天发出邀请函,宣布将于美国太平洋时间10月18日10点(北京时间10月19日凌晨1点)举行线上特别活动。这是苹果今年的第二场秋季发布会,苹果为这次发布会喊出的口号是“来炸场”。苹果邀请函Mac产品线预计将是此次发布会的主角。新款MacBook Pro将迎来自2016年10月推出

  • 喋血复仇加速器那个好?专用加速器推荐

    Turtle Rock Studios工作室新作《喋血复仇(Back4 Blood)》将于 10 月 13 日正式发售,登陆PC、PS4、PS5、Xbox One以及Xbox Series X | S平台,Steam版预购正在进行中。在Steam上共有三个版本供玩家选择:标准版、数字豪华版以及终极版,预购玩家将获得一个武器皮肤包。预购游戏豪华版的玩家已经可以抢先体验游戏正式版了。根据抢先体验和B测用户游戏体验反馈,游戏联机时经常遇到高延迟、卡顿、掉线、报错等问题,十分影响游戏体验?

  • 《永劫无间》帧率怎么提升?京天华盛&英伟达直播为您解密

    如果问最近哪款游戏最火,《永劫无间》应该是很多玩家的选择,这款由网易旗下独立运营的子公司“24 Entertainment ”工作室自主开发的新旗舰无拘动作竞技端游,公开测试版在几个月前成为 Steam 上最热门的 10 款游戏之一。对于各位玩家来说,想要畅玩这款武侠吃鸡游戏,应该选哪款配置?在不降低画质的情况下如何提高游戏帧率? 10 月 1 日晚 7 点,国庆节狂欢购,京天华盛联合英伟达,将给各位带来一场GeForce RTX? 30 系直播,京

  • 双路径带货,抖店生意增长加速器

    抖店作为抖音官方经营的电商入口,是抖音电商商家实现一站式经营的平台。2021年,抖店交易额飞速增长,GMV较2020年1月同期增长超50倍。这出挑的成绩让行业瞩目,众多商家、品牌纷纷涌入抖店,但是许多新手却在初期就遇到了销量难以打开的难题。其实,这是没有充分发挥抖店“商家自营”与“达人带货”双路径带货优势的问题。商家自营商家自营包括了商家自播与短视频带货两种形式,可以实现商家在平台的持续经营。为了能够让自播更具

  • 微软和英伟达宣布推出自然语言生成模型 MT-NLG

    据微软官网发布的博客文章显示,微软和英伟达宣布了由 DeepSpeed 和 Megatron 驱动的 Megatron-Turing 自然语言生成模型(MT-NLG),这是迄今为止训练的最大和最强大的解码语言模型。

  • AMD工程总监:FSR采用率喜人 机器学习不是唯一的最佳解决方案

    尽管推出不到四个月,AMD 对标英伟达深度学习超级采样(DLSS)的 FidelityFX Super Resolution(简称 FSR)技术,已经在 20 多款游戏中得到了支持。在周六接受 Eurogamer 的 Digital Foundry 采访时,AMD 工程总监 Nick Thibieroz 表示:“开发者对于 FSR 技术的接纳度和采用率,现已无需赘述”。Nick Thibieroz 声称,FSR 1.0 是 AMD 广泛研究后得出的一项成果,背后是多个团队借助的各种不同的底层改进技术。公司深知 FSR 1.0 会

  • 手握台积电4nm+Arm V9 黄金组合,联发科下一代天玑旗舰芯片将站稳高端市场

    时间来到九月,有关下一代旗舰芯片的消息陆续浮出水面。近日就有多位知名数码博主先后爆料称,下一代天玑5G旗舰芯片将采用目前最强的台积电4nm制程,同时采用Arm V9架构,硬件规格达到顶级旗舰水准,瞬间引来了一波业内的强烈关注,而这背后,或许也夹杂着今年“5nm发热”的一种种遗憾。有业内人士认为,凭借爆料中提到的台积电4nm与Arm V9这对黄金组合,下一代天玑旗舰芯片将是明年移动芯片性能和功耗的“天花板”。同时手握这两?

  • 微软和AMD可能正共同设计一款带有RDNA 2 GPU的定制ARM处理

    微软在上周推出了Surface Pro 8和Surface Duo2,这两款产品内部都包含x86硬件,但没有任何一款产品采用了Arm芯片。什么原因呢?一个可能正在进行中,而AMD可能参与了设计。目前这只是一个传言,但也许是一个可信的传言,因为两家公司都对Arm感兴趣。本月早些时候,在德意志银行技术大会上,AMD首席财务官Devinder Kumar回答了关于Arm的问题,他说AMD与该公司有"非常好的关系",并补充说"我们理解客户希望与我们合作",提供基于Arm?

这篇文章对你有价值吗?

  • 热门标签

热文