首页 > 业界 > 关键词  > InfinityCache最新资讯  > 正文

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

2022-11-14 20:49 · 稿源: 快科技

作为各家新处理器、新显卡平台中最后一个登场的,AMD RDNA3架构的RX 7000系列显卡终于来了!

新品正式解禁上市前,AMD也向快科技分享了诸多细节,包括芯片设计、架构布局、技术特性等,一起先睹为快!

AMD高级副总裁、大中华区总裁潘晓明先生(Spencer Pan)表示,AMD一直致力于将优异的Radeon显卡带给发烧友和游戏市场,用不断精进的图形能力令用户收获极致体验,用一款又一款的优秀产品引领行业进入一个全新高性能时代。

对于全新的RX 7000系列显卡,潘晓明一样充满了期待与憧憬,并强调,AMD将一如既往的为广大玩家和行业带来优秀的产品,满足时代的需求。

AMD Radeon技术事业部工程研发高级副总裁王启尚表示,AMD的愿景是为全世界数十亿的游戏玩家能够提供更卓越的游戏体验,包括锐龙处理器、Radeon显卡、云游戏服务,以及PS5、Xbox Series X/S、Valve Steam Deck新一代的游戏机,还有最新的特斯拉电动汽车,把游戏体验带进汽车市场。

OK,接下来进入RDNA3的奇妙世界。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

众所周知,如今的高端GPU越发复杂、庞大,晶体管数量动辄几百亿,尽管有更先进工艺的加持,但在性能提升的同时,功耗也急剧飙升,不得设计夸张的散热方案,甚至离不开水冷,导致能效比(每瓦性能)非常差。

AMD RDNA则从诞生开始就是一个极其高能效的GPU架构。初代就比此前的Vega架构在能效提升了多达50%,RDNA2又提升了54%,如今的RDNA3居然再次提升了54%,又一次超越了原定的设计目标!

三代RDNA架构发展下来,能效累计提升幅度已经超过350%,在整个GPU历史上都堪称一个奇迹。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RDNA3架构最大的创新之一,就是将AMD锐龙、EPYC上大获成功的chiplet小芯片设计,第一次引入到了GPU之上

AMD将一颗完整的大芯片按照功能模块划分成不同的小芯片,各自使用最合适的制造工艺,再通过带宽高达5.3TB/s的高性能扇出型封装互连,组合成一个有机的整体。

RDNA3家族的顶级核心Navi 31,一共包括一个GCD、六个MCD。

其中,GCD也就是Graphics Compute Die,包括计算单元、显示单元、媒体单元等,采用先进、昂贵的5nm制造工艺,面积约306平方毫米

MCD也就是Memory Cache Die,包括显存、Infinity Cache无限缓存,采用成熟的6nm制造工艺,单个面积约37.5平方毫米

Navi 31核心总面积约531平方毫米,共有577亿个晶体管,集成密度约1.1亿个晶体管/平方毫米。

相比之下,RX 6900系列所用的Navi 21核心为单芯片设计,台积电7nm,268亿晶体管,面积519平方毫米,集成密度约5160万晶体管/平方毫米。

换言之,Navi 31在总面积几乎不变的情况下,晶体管数量翻番,密度也翻了一倍。

作为对比,NVIDIA RTX 4090 AD102核心仍是单芯片,台积电4N工艺(本质也是5nm),608平方毫米,763亿晶体管,集成密度1.26亿个/平方毫米。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

MCD部分比较简单,每颗内部集成一个64-bit GDDR6显存控制器、16MB Infinity Cache无限缓存,后者频率为2.3GHz。

六颗组成384-bit、96MB的规格,合计带宽最高达5.3TB/s,比RDNA2架构提升了足足2.7倍。

其中单纯由384-bit 20GHz GDDR6显存提供的带宽最高为960GB/s,剩下的超过80%都来自Infinity Cache。

那么,为什么还是不使用更高频率的GDDR6X显存?

王启尚指出,RDNA 3架构旨在提高能效,而GDDR6X显存需要更高的供电以维持更高的带宽。AMD Infinity Cache这样的创新技术搭配GDDR6,就可以在更低的功耗下,实现更高的显存带宽性能。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

GCD部分主要可以分为三大块儿,分别是统一计算单元、显示引擎、双媒体引擎,都是全新设计的。

接下来,我们逐一看下这三大件。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

CU计算单元,仍然是RDNA3的基本组成模块,但这次焕然一新,而且有了新名字,叫做统一计算单元”。

何谓统一?就是图形渲染、光线追踪、人工智能可以共享所有的计算资源,提供更高的单位功耗性能、单位面积性能。

计算单元内部又可以分为几个不同功能模块,首先是VGPR(通用寄存器),负责资源的共享与调度分配,其容量比RDNA2上增加了50%,从而提升了所有功能的性能。

顺带一提,计算单元部分的集成度非常高,单位面积晶体管比上代增加了足足165%。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

流失处理器模块,RDNA3架构迈进了一大步,采用Dual Issue也就是双路发射设计,能够向Wave32 SMID单元同时派发两路不同的指令。

这个指令可以是整数,可以是浮点,可以是AI,看需要而定。

这就让指令分发效率直接提升了一倍,可以更好地利用计算单元中的所有功能,达成更高的性能、能效,而且混合指令的利用也更加灵活、高效。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RDNA3还极大地强化了AI,每个计算单元内有两个AI加速器,并加入新的AI指令,提升AI吞吐量,综合性能提升超过2.7倍,可以轻松满足当下乃至未来AI加速场景的需求。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

光线追踪也进化为新一代,可实时跟踪的光线数量增加了多达1.5倍,还有新的光追专用指令集、新的光线盒排序与遍历算法。

最终,RDNA3每个计算单元的光追性能提升了多达50%,虽然不能说超越对手,但至少大大缩小了差距。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RDNA3架构还设计了新的时钟频率解耦”(Decoupled Clocks)机制,也就是让着色器、前端的工作频率彼此独立,都跑在最合适的频率上。

其中,前端频率为2.5GHz,比上代提高了15%,可以更高效地处理工作负载;着色器频率为2.3GHz,能效更高,可以节省最多25%的功耗。

这一设计也为整体能效再进一步做了很大的贡献。

总的来说,凭借一系列改进,RDNA3的计算性能提升了足足2.7倍,浮点计算能力达到61TFlops(每秒61万亿次计算)。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

多媒体一直是AMD GPU的强项,各种新技术、新标准总是会优先尝试。

RDNA3集成了新的Radiance显示引擎,不但支持HDMI 2.1a,还行业第一家率先支持最新的DisplayPort 2.1视频输出标准,包括UHBR 13.5,而现在距离新标准正式发布还不到一个月!

DP 1.2可提供最高54Gbps的显示链接带宽,这足以支持8K165Hz、4K480Hz、2K900Hz的超高清高刷显示输出,还能以每通道12-bit色深,渲染出惊人的680亿种颜色。

支持如此超高分辨率、超高刷新率,一方面可以显示更丰富、更高质量的视频内容,另一方面也可以更适应超高帧率游戏。

RX 7900系列本就是面向未来4K游戏的,而在当下主流的2K分辨率,很多游戏都可以跑出超高帧率,比如《守望先锋2》超过600FPS,《无畏契约》超过800FPS,使用DP2.1可以让游戏帧率、显示器刷新率更加匹配,游戏体验更加丝滑。

戴尔、三星、华硕、LG、宏碁等都在开发DP 2.1接口的显示器,预计将从2013年初开始陆续上市。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

最后是新的双媒体引擎,频率提升多达80%,首次加入了对AV1格式的支持,可以做到8K60的编码、解码。

目前,各家GPU方案都已经完整支持AV1,再加上移动SoC的跟进,硬件平台已经完全到位。

另外,RDNA3还支持AVC、HEVC(H.265)格式的同步编解码,效率更高,并引入了AI增强视频编码,包括串流预分析、串流预滤波等。

值得一提的是,RDNA3架构还支持全新的SmartAccess Video协同编解码技术,可在锐龙处理器、Radeon显卡之间智能划分解码和编码工作负载,4K分辨率下的多串流编码中,可提供最高30%的性能提升。

汇总一下RDNA3 Navi 31 GPU的主要亮点:

1、首次小芯片设计,频率提升15%,能效提升54%。

2、峰值带宽提升2.7倍,浮点性能高达61TFlops。

3、统一计算单元,每时钟周期双指令发射,升级光追单元,加入AI单元。

4、全新显示、媒体引擎,完整支持DP 2.1输出、AV1编解码。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

游戏特性方面,重点说一下AMD FSR。

截止10月底,AMD FSR超分辨率技术已经覆盖216款游戏,其中85款已为最新的FSR 2.x。

下一个小”版本是FSR 2.2,重点进一步改善画质,比如减少快速移动物体的重影,同样基于时域放大算法,不需要依靠AI或者专用的AI硬件,《极限竞速:地平线5》首发支持。

下一个大”版本是FSR 3,支持全新的AMD Fluid Motion Frame补帧技术,预计可带来比FRS 2最多2倍的帧率提升,2023年推出,正面对标NVIDIA DLSS 3。

产品方面首发两款,再回顾下主要规格:

RX 7900 XTX:

96个计算单元,96MB Infinity Cache缓存,核心游戏频率2.3GHz、最高就是频率2.5GHz,搭配384-bit 24GB GDDR6显存,等效频率20GHz,整卡功耗355W。

RX 7900 XT:

84个计算单元也就是精简1/8,Infinity Cache缓存减少到80MB,核心游戏、加速频率分别降至2.0GHz、2.4GHz,显存位宽降至320-bit,容量20GB,整卡功耗也降至300W。

值得一提的是,AMD(ATI)上一次使用XTX”为旗舰显卡命名,还要追溯到2006年的 Radeon X1950 XTX、X1900 XTX,已经过去了16年之久。

AMD表示,选择让XTX品牌回归,意在向世界宣布RX 7900 XTX将是AMD中更强大的显卡。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

RX 7900系列公版设计基本延续了RX 6900系列的风格,三风扇,标准2.5插槽厚度,长度从276mm略微延长到287mm,机箱兼容方面不会增加困难。

辅助供电接口仍是两个标准的PCIe 8针,而没有使用新的、容易莫名烧毁的PCIe 5.0 12VHPWR 16针接口,确保兼容性和安全性,同时供电能力从330W增加到355W,可以提供更充裕的空间。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

性能方面,解禁之前先看看一些官方数据。

RX 7900 XTX 4K游戏性能相比于RX 6950 XT提升最多达70%,大量游戏可提升50%。

RX 7900 XT也能带来最多50%的性能提升。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

光追性能也取得了巨大的进步,4K分辨率和超高画质下,《赛博朋克2077》、《消逝的光芒》、《杀手3》等游戏可带来50-80%的性能飞跃,都轻松超过60FPS的平均帧率及格线。

AMD RDNA3架构深入揭秘:一大分七小、AI/光追飞跃!

显卡将于12月13日正式上市,RX 7900 XTX定价仅为7999元,相比RTX 4090便宜了接近40%,预计和RTX 4080基本在同一档次,但性能显然会碾压后者。

RX 7900 XT定价为7399元,势必会给只有192-bit显存的RTX 4070 Ti以极大的压力。

王启尚也强调,AMD的理念是希望能够把发烧级的、面相未来的显卡,用比较亲民的价钱,让更多的游戏玩家能够有全新的体验。

华擎、华硕、技嘉、微星、撼迅、蓝宝石、瀚铠、讯景、盈通等品牌都会在第一时间发布各自的RX 7900系列显卡,并同步上市。

备货方面,AMD表示整个团队都在夜以继日地准备供货,预计应该是充足的,但不排除玩家热烈追捧,初期供需紧张。

举报

  • 相关推荐
  • AI日报:Sora免费额度要缩水;月之暗面发布Kimi Linear架构;Canva免费放出Affinity专业设计套件

    本期AI日报聚焦多项技术突破:OpenAI调整Sora免费额度并推出付费计划,标志视频生成进入商业化;Figma收购Weavy推出AI设计工具;OpenAI发布基于GPT-5的安全研究助手Aardvark;全球首款AI字体生成器Dr Fonts上线;中国信通院发布大模型一体机应用报告;月之暗面推出Kimi Linear架构实现推理速度6倍提升;Canva免费发布Affinity设计套件挑战Adobe;Chrome新增Gemini驱动的图像生成与深度搜索功能。

  • 兑现承诺!中国梦确权资产首期 120 亿补助到账,1900 名追梦人率先圆梦

    财政部统筹的中国梦确权资产首期资金今日释放,120亿元财富红利精准安全流向全国1900名率先达标的个人会员。这是国家对共同富裕承诺的直接兑现,资金将转化为教育投入、住房改善等实际动力。通过先富值机制严格筛选,体现贡献优先原则,全程透明可追溯。中银香港呼吁未达标会员积极学习首批圆梦者经验,抓住机遇参与战略建设。

  • 小米第一款9000mAh手机来了!支持100W闪充

    据爆料,Redmi Turbo 5系列预计12月至1月发布,将搭载天玑8500/9500e或骁龙8 Gen5芯片,性能强劲。配备9000mAh硅碳电池与100W快充,实验室方案积极评估10000mAh。该系列定位接棒原2K价位段,主打高性价比,产品经理称在性能和价格上均会带来惊喜。

  • Mini LED时代即将终结!MacBook Pro将升级为OLED屏

    苹果爆料人Mark Gurman透露,MacBook Pro会率先升级OLED,时间是明年下半年,然后MacBook Air再跟进OLED,时间是2028年,届时MacBook Pro和MacBook Air都将全面迈入OLED时代。 Mark Gurman指出,苹果旗下的iPad系列、MacBook机型全部都将启用OLED屏幕,包括iPad mini、MacBook Pro、iPad Air和MacBook Air,且大概率会按此顺序推进。PS:入门款iPad暂无搭载OLED的计划。 值得注意的是,MacBo

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • 微算法科技(NASDAQ MLGO):以隐私计算区块链筑牢多方安全计算(MPC)安全防线

    微算科技开发的隐私计算区块链将区块链技术融入多方安全计算(MPC),构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约,对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护,确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性,在金融、医疗、政务等领域实现跨主体数据安全协作,释放数据价值。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • 999元起!联想moto g100s开售:LCD护眼屏、支持微信/抖音6开

    联想官方今天宣布,moto g100s正式开售,定价是999元起。 这是近期少有的LCD手机,搭载6.72英寸LCD防蓝光无频闪护眼屏,支持120Hz高刷新率与全局DC调光,硬件级过滤蓝光、消除频闪,局部峰值亮度1050nits。 内置7000mAh超大容量电池,采用10%硅负极技术提升能量密度,电池循环寿命超1000次,6年使用后容量仍80%,支持30W有线快充 搭载第四代骁龙6s处理器,性能满足日常社交、短视�

  • 华为Mate 70 Air配置价格公布:可选CPU 售价4199起

    华为Mate70 Air于11月6日10:08开启预售,提供麒麟9020B和9020A两款CPU版本,价格从4199元至5199元。机身仅6.6mm厚、208g重,配备7英寸OLED临境大屏,支持120Hz刷新率。影像系统包括后置四摄组合与前置1070万超广角镜头,内置6500mAh电池与66W快充。支持双向北斗卫星消息、Wi-Fi7,预装HarmonyOS 5.1系统。凭借轻薄设计、可选CPU及全面配置,有望引发市场关注。

  • 未来iPad mini/iPad Air/MacBook都将升级OLED屏:LCD退场

    苹果正在研发搭载OLED显示屏的iPad mini、iPad Air、MacBook Pro和MacBook Air机型,苹果已在iPad Pro中采用OLED屏,并计划在未来数月及数年内将OLED推广到更多设备上,从而淘汰LCD屏幕。 具体来看,iPad mini最快会在2026年配备OLED屏,同时会提升防水性能,新款iPad mini也因此涨价100美元。 至于iPad Air,其商用OLED的时间要晚于iPad mini,爆料称2026年春季亮相的iPad Air将继续使用LCD屏幕,但后续

今日大家都在搜的词: