首页 > 业界 > 关键词 > nvidia最新资讯 > 正文

AMD RDNA 2 GPU与NVIDIA的安培GPU对决内存延迟性

2021-04-19 21:30 · 稿源:cnbeta

Chips and Cheese测试了AMD的RDNA 2和NVIDIA的Ampere GPU架构的内存延迟性能,并发现了一些有趣的结果。

AMD的RDNA 2 GPU与NVIDIA的Ampere GPU架构相比,具有卓越的内存延迟性能。在CPU方面,随着多芯片die和同一die上的多个IO芯片的不断使用,测量缓存和延迟性能已经成为一个关键的指针。GPU也是由多个缓存层次组成,填补了计算和内存性能之间的空白。

这次测试使用基于OpenCL的指针跟踪基准测试来测量当前一代GPU(如NVIDIA Ampere和AMD RDNA 2体系结构)上的缓存和内存延迟性能。在基准测试中,AMD Radeon RX 6800 XT(RDNA 2 GPU)与NVIDIA GeForce RTX 3090(Ampere GPU)进行了对决。缓存和内存基准测试显示,AMD的RDNA 2架构表现远好于NVIDIA的Ampere GPU,尽管在去往内存的路上要多检查两级缓存,但延迟时间更低。使用Infinity缓存只比L2命中增加了20ns,仍然比NVIDIA的Ampere快。

NVIDIA Ampere GA102 GPU体积大了很多,使用了比较传统的GPU内存子系统,只有两级缓存,但却要耗费大量的周期,导致延迟(L1到L2)超过100ns。而RDNA 2的延迟则只有66ns。需要注意的是,AMD Navi 21 GPU的体积更小,只有4 MB的二级缓存,而NVIDIA GA102 GPU的整个芯片有6 MB的二级缓存。NVIDIA A100 Ampere GPU for HPC则拥有庞大的40 MB二级缓存。

RDNA 2的缓存速度很快,而且数量很多。与Ampere相比,各级别的延迟都很低。Infinity Cache只比L2命中增加了20ns左右,延迟比Ampere的L2还低。令人惊奇的是,RDNA 2的VRAM延迟与Ampere差不多,尽管RDNA 2在通往内存的路上多检查了两级缓存。相比之下,Nvidia坚持使用更传统的GPU内存子系统,只有两级缓存,L2延迟很高。从Ampere的SM-private L1到L2缓存需要超过100 ns。RDNA的L2与L0的距离约为66ns,即使它们之间有L1缓存。绕过GA102庞大的die似乎需要很多周期。

这可以解释AMD在较低分辨率下的优异性能。RDNA 2的低延迟L2和L3缓存可能会在较小的工作负载下给它带来优势,相比之下,Nvidia的Ampere芯片需要更多的并行任务才能大放异彩。与旧的Pascal和Maxwell芯片相比,Ampere架构在更大的GPU上带来了高度改善的延迟速度。另一方面,AMD在与旧的基于GCN和VLIW架构的芯片相比,也有一些令人印象深刻的进步。一旦新一轮基于芯片的GPU在未来几年登陆游戏领域,这些数据的比较肯定会很有趣。

这篇文章对你有价值吗?

  • 相关推荐
  • 大家在看
  • GPU延迟对比:AMD RDNA2完胜NVIDIA安培

    CPU缓存与内存延迟测试,相信大家都有所耳闻,但是GPU同样的测试却几乎没人做过。Chips And Cheese就做了一次特别的测试,对比考察了AMD、NVIDIA GPU架构的缓存、显存迟问题。首先是AMD RDNA2、NVIDIA Ampere两家最新架构的比拼,代表是RX 6900 XT、RTX 3090,前者在几乎所有阶段都完胜。RNDA2架构创新性地加入了Infinity Cache无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约20ns的延迟,明显低于Ampere

  • NVIDIA:显卡缺货将持续到年底、努力增加供应

    日前有消息称NVIDIA将推出新版RTX 3060,这次会真正封杀挖矿性能,可以看出NVIDIA多少还是希望照顾下游戏显卡市场的,毕竟这是他们的根基。但是在挖矿没有退烧反而愈演愈烈的情况下,显卡自由不是那么容易的。在日前的投资者会议上,NVIDIA CFO Colette Kress也回应了显卡缺货的问题,她指出显卡缺货的问题会一直持续到年底。不过缺货不会限制NVIDIA的业绩增长,Colette Kress表示NVIDIA在努力增加供应,但没有给出具体的信息。从G

  • 英国政府以国家安全为由调查NVIDIA收购ARM案

    英国竞争和市场管理局已被下令调查NVIDIA拟收购英国公司ARM。NVIDIA之前宣布以创纪录的400亿美元收购ARM已经遭到高通等公司的反对,并被英国竞争和市场管理局(CMA)审查。现在,英国出于国家安全的考虑,希望加强CMA的活动,开始进行 "第一阶段"调查。据伦敦报纸《Evening Standard》报道,英国文化大臣奥利弗·道登已下令采取进一步行动。"在仔细考虑了对ARM的收购建议后,我今天以国家安全为由发出了干预通知。作为下一步,并帮

  • 为遏制挖矿 Nvidia所有RTX 30系列显卡将升级Ampere GPU核心

    为进一步遏制挖矿,Nvidia 即将发布的 GeForce RTX3080Ti 以及当前所有 RTX30系列都将会配备经过修改的 。全新的 GPU 核心会装备在 GeForce RTX30系列所有显卡中,不过目前已经发售给用户的显卡不受影响。Nvidia 在 RTX3060显卡上率先进行了防止挖矿的核心,不过由于意外偷跑的驱动更新导致这个限制形同虚设。据消息人士透露,最初一批基于 GA102-225-A1GPU 核心的 GeForce RTX3080Ti 显卡仍然没有完全防止加密货币挖矿。目前 QS ?

  • 法拉第未来:FF 91将搭载英伟达最新NVIDIA Drive Orin平台

    法拉第未来(FF)宣布将在FF91电动车上搭载英伟达NVIDIA Drive Orin平台芯片。FF91计划在2022年上市时实现高速公路自动驾驶功能以及停车和召唤功能。

  • NVIDIA神秘SoC处理器曝光:从未见过的CPU、GPU架构

    NVIDIA虽然没有通用的处理器,但在自动驾驶等领域,一直都在打造自己的SoC,融合ARM CPU架构以及自家的先进GPU架构,尤其是后者,甚至往往比起专业卡、游戏卡都要领先一步。今天收到曝料,NVIDIA正在设计一款代号“Atlan”的全新SoC,面向自动驾驶领域,也是2019年宣布的“Orin”的继任者——两个代号都来自亚特兰蒂斯传说,Orin是亚特兰蒂斯的第一任国王“奥林”,Atlan则是奥林的父亲“阿特兰”。从泄露的结构图上看,Atlan SoC?

  • NVIDIA下重手 RTX 3080 Ti这次彻底封杀挖矿了

    NVIDIA的RTX 30系列显卡今年还会陆续扩展,高端、低端都会有新品,传闻已久的RTX 3080 Ti显卡已经箭在弦上,很快就要发布了。按照之前的爆料,RTX 3080 Ti定价999美元,也就是和RX 6900 XT海外定价一致(国行7999元),5月发售上市。规格方面,RTX 3080 Ti预计会将流处理器减少到10240个,显存则变为384-bit 12GB GDDR6X。大家都很清楚,在当前的情况,RTX 3080 Ti显卡的建议价没有什么意义,最终要看实际售价,而这跟它的挖矿能力

  • NVIDIA官宣全新自动驾驶平台:下代CPU+下代GPU

    除了基于ARM架构、面向AI/HPC的自主CPU处理器“Grace”,NVIDIA今天还发布了下一代全新自动驾驶平台“DRIVE Atlan”。这也是NVIDIA的第四代自动驾驶平台。第一代“Parker”(蜘蛛侠彼特·帕克)诞生于2018年,算力1TOPS(每秒1万亿次操作),两年后迎来了“Xavier”(X教授),算力突破30TOPS,而第三代“Orin”(亚特兰蒂斯首任国王奥林)计划明年落地,算力达到254TOPS。“Atlan”(奥林之父亚特兰)则要等到2025年才会商用,其算力突破100

  • [图]Nvidia将推Atlan:面向汽车行业的下一代SoC

    NVIDIA Atlan 是面向汽车行业的下一代 SoC。从命名来看,Nvidia 还在使用《海王》(Aquaman)系列中的名字。早在 2019 年开始,Nvidia 宣布的 Orin SoC,就是以亚特兰蒂斯的第一统治者命名的。而今天 Nvidia 宣布了以 Orin 之父命名的 Atlan SoC。Atlan SoC 采用了 Grace-Next CPU 和 Ampere-Next GPU。该芯片还集成了 Bluefield 数据处理单元(DPU)。不过遗憾的是,除了图片并没有太多的细节公布,因此目前我们无法完全确定规格?

  • NVIDIA发布6款RTX专业显卡:安培架构、图形工作站专用

    NVIDIA安培显卡家族迎来大扩军,一口气上新了多达六款型号,但不是游戏卡,而是图形工作站用的专业卡,也即是曾经的Quadro系列(这个品牌已被弃用),面向艺术家、设计师、工程师等人群。

  • 英伟达(NVIDIA)以400亿美元收购Arm面临英国政府的干预

    据国外科技媒体报道:英国政府将调查美国英伟达以400亿美元收购英国芯片设计公司Arm对国家安全的影响。数字部长奥利弗道登(oliverdowden)表示,他已经就出售Arm发出了干预通知。&#英伟达表示:我们将继续与英国当局密切合作,就像我们宣布这笔交易以来所做的那样。

  • 英国干预NVIDIA 400亿美元鲸吞ARM!黄仁勋:有信心明年完成

    NVIDIA 400亿美元收购ARM已经宣布了半年多,但仍然悬而未决,面临各国监管机构的审查和批准,但是NVIDIA CEO黄仁勋明确表示,有信心在明年完成收购,也符合最初预计的18个月的期限。黄仁勋表示,相信监管机构能够认识到这笔交易是明智的,它会大大推动创新,创造新的市场机遇,能够让ARM进入此前难以触及的市场,同时和以往的很多合作一样,它会将AI带入ARM生态系统,将NVIDIA的加速计算平台带入ARM生态系统,而这只有NVIDIA与一众

  • 与IntelNVIDIA的决战开始 AMD股东批准350亿美元收购赛灵思

    日前AMD股东、赛灵思的股东以压倒性优势双双批准了AMD收购赛灵思的交易,预计今年内完成,尚需完成全球监管部门的审批。

  • 看到科技发布12K 3D影视级VR摄影机Kandao Obsidian Pro

    2021 年 4 月 15 日,深圳看到科技(Kandao Tech)在北京索尼影像中心召开新品发布会,正式发布全球首款12K3D超高清专业VR摄影机Kandao Obsidian Pro。Kandao Obsidian Pro以其全面领先的性能参数,重新定义了全球VR影视拍摄的新标准。其主要特性包括:1、原生支持拍摄12K*12K30FPS的3D全景视频,并支持60FPS的超分12K*12K3D全景视频制作;2、搭载 8 颗APS-C传感器,提供比M4/ 3 传感器更好的画质表现;3、 配备 8 颗定制超6K f2.

  • Expedia推出COVID-19旅行限制咨询工具

    据外媒报道,今日,英国的封锁明显放松,该国政府再次表示,人们可以开始考虑海外度假了。不过在现在这个特殊的大流行背景下人们究竟怎样才能做到更加安全的出游呢?Expedia就是一个相当好的帮手。比如从海外旅行回来的英国人,该工具会给出以下建议:所有旅客抵达英国后都需进行为期10天的隔离。从阿富汗、阿尔巴尼亚抵达英国的旅客可以在家里隔离,另外必须在旅行前预订旅行检测包以便在隔离的第2天和第8天进行检测。他们也可以?

  • 携手《王者荣耀》,MediaTek持续优化游戏用户体验

    MediaTek天玑系列5G移动芯片不仅拥有高性能、低功耗的特点,还搭载MediaTek独家的HyperEngine 游戏优化引擎,通过芯片层技术,从游戏的网络、触控、画质、处理器负载调控等方面进行优化,打造了包括游戏通话双卡并行、超级热点和5G高铁游戏网络模式、以及高刷省电等等提升游戏体验的诸多功能,不仅在游戏网络优化方面获得了德国莱茵TüV Rheinland的官方测试认证,也与腾讯游戏建立了深度合作关系。在持续提升芯片性能和技术的同时

  • 海鲨游戏带你走进《PUBG手游》刺激战场 国服ID直冲

    PUBG 手游是一款以第一和第三人称视角展现的吃鸡手游,花样百出的竞技策略,成就不同的吃鸡王者,战场多变考验玩家策略能力,是成为狙击杀手还是突击精英,全部都掌握在你手中哦! 海鲨游戏今天给吃鸡玩家带来的强力福利,无需登录,秒速到账,国际服手游,客服24小时服务,充值无障碍。让你带来一种前所未有有的游戏体验。全新《PUBG手游》秒充值捷径来啦怎么充值呢?大家如果平时想要愉快地充值的话发现手机是不那么好充值的,可?

  • AMD取代苹果成为台积电7nm主要客户

    消息人士透露,AMD已经成为台积电最大的7nm工艺客户,取代了苹果原本的这一位置,而苹果公司现在主力产品均采用5nm工艺,因此也让出了这一工艺产能。有报道称苹果公司已经获得了台积电5nm工艺80%的产能。

  • Xbox Insider现在可以玩免费多人游戏 无需订阅Xbox Live Gold

    微软正准备让Xbox游戏机上的免费多人游戏真正免费,现在所有Xbox Insiders都可以玩这些游戏,而无需订阅Xbox Live Gold。昨天发布的Omega Xbox Insiders的最新Insider构建版放弃了免费游戏中的多人游戏以及Looking 4 Groups和Party Chat等功能的Xbox Live Gold要求。这些服务政策变化之前,会依次向Xbox Insider Alpha、Beta和Delta通道铺开,但Omega是唯一一个对所有Xbox玩家开放的通道,他们有兴趣在新功能普遍可用前不久进行测?

  • 3月头号恶意软件:IcedID银行木马跻身恶意软件指数排行榜前十名

    Check Point Research 报告指出,在利用新冠肺炎疫情诱骗新受害者后,IcedID 首次跻身全球恶意软件指数排行榜,位列第二。 2021 年4 月13 日 – 全球领先网络安全解决方案提供商 Check Point ? 软件技术有限公司 (纳斯达克股票代码:CHKP)的威胁情报部门 Check Point Research (CPR) 发布了其2021 年3 月最新版《全球威胁指数》报告。研究人员报告称,IcedID 银行木马首次进入该指数榜单,位列第二,同时 Dridex 老牌木马从2 月

  • 热门标签