首页 > 业界 > 关键词  > amd最新资讯  > 正文

AMD Instinct MI200加速卡或拥有110组计算单元:MCM GPU架构加持

2021-09-02 10:50 · 稿源: cnbeta

Coelacanth's Dream 刚刚在 GitHub 上发现了一份近期提交的代码,可知其中揭示了有关即将到来的基于 AMD Aldebaran GPU 的 Instinct 加速卡的一些细节。据悉,代号为“GFX90A”的该系列 GPU 将采用 CDNA 2 架构,同时它也是 GFX 9th Family(Vega 家族)的衍生型号。

(图 via WCCFTech)

其中包括了 GFX906_60、GFX908_120 和 GFX90A_110 三个代码,预计分别对应 Instinct MI60、MI100、以及新一代 HPC 加速器 SKU 。

从型号命名规则上来看,猜测 MI60 / MI100 分别拥有 60 / 120 组计算单元(CU)。奇怪的是,GFX90A_110 的计算单元竟然比 MI100 更少。

(截图 via VideoCardz)

虽然有消息称 Aldebaran GPU 将拥有 128 组 CU,但这与我们看到的有关 AMD 下一代 Instinct 加速卡的规格有些不符。

不过考虑到厂商会按需屏蔽部分瑕疵单元(渲染引擎 / 计算单元),我们对 110 CU 的 GPU SKU 也并不感到意外。

Coelacanth's Dream 预计:MI200 的 Aldebaran GPU 采用了双拼的 MCM 设计,每边都有 56 个 CU 。分别屏蔽其中一个的话,就组成了 110 个。

目前尚不清楚 AMD 是否计划将 CDNA 2 架构上的 FP32 内核数量增加一倍。

假使该公司这么做,那下一代 Instinct 计算卡有望在 1500 MHz 的时钟频率下,达成 42.2 TFLOPs 的单精度算力(即 MI100 的 1.82 倍)。

若没有这么做,则 MI200 需要将 GPU 频率至少提升至 1650 MHz,才能达到 23 TFLOPs 的 FP32 吞吐量。

不过对于 MI200 之类的 HPC 加速卡来说,FP64 的性能显然更加重要。由早前泄露的消息可知,MI200 将具有全速率的 FP64 性能,意味其性能可达到 MI100 的两倍或四倍(具体取决于选用了怎样的架构设计)。

如果一切顺利,AMD 或在 2021 年底前发布 MI200 。作为该公司革命性的 MCM 多芯片 HPC 加速卡,它还将板载 128GB 的 HBM2e 高带宽缓存。

举报

  • 相关推荐
  • 免费测试1%低帧:CapFrameX升级支持锐龙9000、酷睿Ultra 200S

    越来越多的玩家意识到了1%低帧对游戏流畅性的重要性,但现有测试软件一般无法方便地考察这一目标,有些甚至是收费的,CapFrameX就是一款免费好用的工具,现在发布了最新的1.7.4版本。CapFrameX1.7.4最大的变化,就是正式支持AMDZen5架构的锐龙9000系列,以及IntelArrowLake即酷睿Ultra200S系列。最关键的是,它免费开源,官网提供源代码。

  • 京东11.11 音频C2M定制品增长110% 个性化定制受热捧

    在京东11.11音频爆款真5折、政府补贴等多重优惠加持下,京东11.11音频品类交出了一份亮眼的成绩单,10月14日0点至11月11日24点,音频品类实现全线增长,购买新品用户同比增长高达100%,C2M定制品成交额同比增长110%,进一步验证了京东在精准匹配消费者需求、推动定制化服务方面的卓越能力。从耳机音箱消费趋势来看,消费者强烈追求更加自由、舒适的佩戴体验,京东11.11开放式耳机成交额同比增长超3倍。京东将携手更多耳机音箱品牌,为消费者带来更多更好的音频产品和服务,打造“又便宜又好”的音频消费体验。

  • 苹果计划2025年推出M4 Ultra芯片:至高拥有32核CPU、80核GPU

    目前,苹果正式推出了三款M4芯片组,然,备受期待的M4Ultra芯片却并未亮相。知名爆料人马克古尔曼近日透露,苹果计划在明年发布M4Ultra。这也解释了《赛博朋克2077:终极版》将于2025年登陆Mac的原因,更令人期待的是,光线追踪和帧生成技术都将集成在这一移植版本中。

  • 裸金属 GPU 上线!DigitalOcean 提供单用户独享H100资源

    对于需要直接控制硬件,需要更强性能的AI开发者来讲,DigitalOcean已经为你们准备好了更适合的GPU服务器——DigitalOcean基于NVIDIAGPU的裸金属服务器。这些服务器特别设计用来应对最复杂的AI和机器学习任务,无论是大规模的模型训练还是高度定制的基础设施设置,都能轻松胜任。如需预约测试裸金属GPU服务器,咨询更多相关信息,可联系DigitalOcean中国区独家战略合作伙伴卓普云。

  • 加速替代CUDA!摩尔线程开源vLLM-MUSA 加速国产GPU AI

    近日,摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。摩尔线程表示,正努力围绕自主研发的统一系统架构GPU、MUSA软件平台,构建完善好用的MUSA应用生态。摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期提供MUSIFY自动代码移植工具等一系列实用工具和脚本。

  • 酷睿Ultra 200U系列型号、规格全曝光:架构不变、频率拉高

    Intel早已官宣,将在明年初的CES2025上宣布面向高端游戏本的ArrowLake-HX即酷睿Ultra200HX系列、面向主流笔记本的ArrowLake-H即酷睿Ultra200H系列。它们都和面向面向桌面的ArrowLake-S酷睿Ultra200S系列一样,基于LionCoveP核架构、SkymontE核架构、Xe-LPG核显架构。性能提升幅度应该还是不小的,只是不会有啥新的技术特性。

  • 深度:一年,TCL 的 2000+零售商全域增长试验

    今年双十一期间,TCL全品类销售额突破34亿,同比增长60%。这样的成绩在TCL中国营销本部新零售营销业务中心总经理于博看来,却是“如果没有以旧换新的国家补贴,将会延续前三个季度家居家装的低迷表现”。工资和奖金的发放将与这些工作的完成情况直接相关。

  • Shopee 11.11大促引爆购物热潮,开场2分钟即售出1100万件商品

    2024年11月13日,中国——东南亚领航电商平台Shopee11.11大促盛况空前,开场2分钟即售出1100万件商品,1.36亿张平台优惠券在2小时内被消费者收入囊中。跨境卖家涨势喜人,跨境强势类目单量大涨8倍。基于旗下三大核心业务:Shopee、Garena和SeaMoney,Sea集团致力于运用科技的力量改善当地消费者及中小企业的生活。

  • 华为发布鸿蒙OS NEXT 5.0.0.110更新:优化通话 系统更稳定

    日前,华为发布HarmonyOSNEXT5.0.0.110SP6更新,更新包大小约623MB,支持华为Mate60系列、Pura70系列等升级。新版更新优化了部分场景语音通话体验,并提升了系统稳定性,华为推荐更新。在今天14:30举行的华为Mate品牌盛典上,除了发布华为Mate70系列、华为MateX6系列等新品外,华为原生鸿蒙系统也将有望正式宣布开启商用。

  • 三年流失2000万MAU,“Tinder们”热乎出炉的财报数据很难看

    a16z知名投资人JustinMoore发推,一口气介绍了多款线下交友的产品/服务,她表示“反DatingApp的情绪已经发展到了‘重塑酒吧’的阶段”。不止是投资人,海外媒体也早已注意到,这一两年在海外以酒吧、餐馆等为据点举办的线下交友活动数量在快速攀升,人们对于回归线下兴致盎然硬币的反面是,在海外走过近30年历程的在线约会业务,可能正在面临着用户需求变化、新业态涌�

热文

  • 3 天
  • 7天