11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
NVIDIA计划在明年1月的CES展会上发布其新一代RTX50系列显卡,除了RTX5090和RTX5080外,RTX5070预计将同台亮相,不过这三款显卡将分别发布。RTX5070显卡将基于GB205GPU,配备12GBGDDR7显存和192bit的位宽,显存速度达到28Gbps,提供高达672GB/s的带宽,与上一代RTX4070相比提升了33%。RTX50系列显卡采用新的PCB背钻工艺,以增强GPU与显存间的信号完整性,支持还支持PCIe5.0和DP2.1a标准,确保与最新硬件的兼容性。
近日,AMD推出了一款面向服务器和云计算市场的RadeonPROV710显卡,主要用于AI推理、VDI和远程工作站以及云游戏等。这款显卡基于RDNA3架构,采用与AMD消费级产品RadeonRX7700XT同款Navi32核心,但运行频率更低。Azure云平台提供的NVv710v5系列实例将搭载这款显卡,并配备AMDZen4架构EPYC霄龙9374F处理器。
大家都在等待RTX50系列桌面显卡,有新架构Blackwell、新显存GDDR7,甚至还有望带来新的工艺、新的DLSS,但其实,笔记本移动版的RTX50Laptop也在开发中。据神舟董事长吴海军在一次活动演讲中披露,RTX50系列笔记本显卡也会采用GDDR7显存,但是否会全面普及是仅限中高端型号,并没有明确。至于RTX50系列笔记本显卡何时发布,暂时没有时间表,明年初的CES几乎肯定是来不及了。
Intel第二代独立显卡Battlemage正在稳步推进,预计今年底或明年初发布,目前正在测试中,时不时就会泄露一些信息,现在就曝出了一份启动信息。根据启动输出信息,Intel第二代图形架构Xe2有多个分支,LPG、HPG、LPM、HPM等等,预计分别对应核显、桌面独显、笔记本显卡。还有个BMG-G10,28个核心,但它是否会发布不得知。
华硕近日低调发布了又一款GT710入门级显卡给它配上了GDDR5显存,再次显示了这种亮机卡”顽强的生命力,类似的还有GT720、GT1030等等,一直都没有真正离去。GT710发布于2016年初,其所用的GK208GPU甚至是2013年初的产物是28nm工艺、Kepler架构,只有192个流处理器、16个纹理单元、8个ROP光栅单元、64-bit显存位宽、DDR3显存,功耗仅仅19W。如果你的处理器核显没法使用,如果你的老爷机想解码视频或者输出高清画面,你如果你对性能没有任何需求只需要亮屏,它还是可以考虑的。
上市1年的国产显卡摩尔线程MTTS70也加入到促销队伍中,只不过价格下调的太猛烈了。从官方公布的促销信息看,现在的摩尔线程MTTS70售价只有899元,如果叠加一些平台的优惠,可能870元左右就能到手。显卡的尺寸为285x112x49mm,主流机箱都能安装。
NVIDIA应该会在今年四季度发布下一代RTX50系列,有的说只有卡皇RTX5090一根独苗,也有的说先发RTX5080再发RTX5090,极大概率NVIDIA自己都还没有完全定下来。之前有曝料称,RTX50系列将会升级到GDDR7显存按照最新说法,RTX5090FE公版不但有GDDR7显存排列更加密集,GB202GPU核心上方4颗、左右各5颗、下方2颗,总计多达16颗。增加显存位宽不但需要芯片内加入更多晶体管,也需要在PCB上配合更多元器件,这也是变成三PCB的一个关键原因。
GDDR7显存标准规范已经公布,NVIDIA、AMD下一代显卡都有望引入,各方面的准备工作都在基金推进。作为JEDEC组织成员,测量仪器厂商IntrospectTechnology宣布已出货全球首个商用的GDDR7显存测试系统M5512”。这套系统可以全方位测试、检验GDDR7显存的各方面表现。
GDDR7显存标准正式公布后,有关于RTX50系列显存配置的消息突然多了起来,先是位宽,现在是速度。根据曝料专家Kopite7kimi的最新说法,RTX50系列首发的GDDR7显存不会达到标准宣称的32GHz是只有28GHz,慢了八分之一。RTX50系列首批搭配的GDDR7单颗还是2GB,更大容量的3GB赶不上了。
改造升级显卡显存容量非常流行,RTX40/30/20、RX6000系列一个也没跑掉,但有时候效果很明显,有时候就不好说了。巴西团队PauloGomes最近接到一个特殊的活儿,有客户觉得自己的RTX20808GB显存太小了,要求升级,甚至贴心提供了显存芯片。这也意味着,游戏在大显存下的严重卡顿现象几乎不见了,非常流畅。
三星、SK海力士都将在2月20日的ISSCC2024国际固态电路大会上,首次展示下一代高速GDDR7显存,但规格略有不同。GDDR7显存不仅会按惯例继续提升速度会改进功耗,为此引入PAM3、NRZ信号调制机制,能在和GDDR6/6X差不多的功耗上带来更高性能。AMDRDNA4RX8000系列还不好说,暂时放弃旗舰卡出于成本考虑,可能不会急着上GDDR7。
据国外媒体报道称,英伟达正在研发6GB显存的RTX3050显卡,预计将在未来几周内发布上市。报道中提到,英伟达准备的这款入门显卡,其要跟RX6600和ArcA580/A750GPU等产品展开竞争。),比8GB显存版的RTX3050低17%,预计功耗大多在70至100瓦之间。
NVIDIA官网低调上线了面向图形工作站的新款专业显卡RTX5880ADA,虽然不是中国特供,但是在旗舰型号RTX6000ADA被禁售的情况下,它是可以自由销售的。RTX5880ADA其实就是RTX6000ADA的精简版,核心还是AD102,CUDA核心从18176个减少到14080个,Tensor核心从568个减少到440个,缩水幅度为22%。具体价格没有公布RTX6000ADA6800美元,RTX5000ADA4000美元。
俄罗斯电商Citilink悄然上线了耕升的一款RTX30506GB显卡,并透露了其他两款版本。NVIDIA最近相当忙活,刚刚发布了中国特供版RTX4090D,这个月内会陆续推出RTX4070SUPER、RTX4070TiSUPER、RTX4080SUPER,下个月则会推出入门级的RTX30506GB。价格预计179美元起,国内应该在1399元左右。
根据近期AIC厂商向欧洲经济委员会提交了文件,显示RX7600XT除了早期技嘉提交过的10GB/12GB版本有一个显存更大的16GB版本。文件至少披露了将要推出两款型号:RX7600XTGAMINGOC16GB、RadeonRX7600XTGAMING16GB。RX7600XT可能会在1月24日发售,发售日期1月24日,届时不妨拭目以待。
NVIDIA将在1月份先后发布RTX4070SUPER、RTX4070TiSUPER、RTX4080SUPER,现在它们的规格已经完全泄露,核心频率、显存配置与频率全部出炉。RTX4070SUPER将在月中率先发布,核心编号AD104-350,CUDA核心数量从5888个增加到7168个,幅度达21.7%,是三款型号中数量最多、幅度最大的。RTX40SUPER系列的发布解禁依然都分为两波,第一天是公版/原价版的评测公布,第二天是高配版的评测公布与集体上市。
今天,摩尔线程发布了全新智算加速卡MTTS4000,训推兼顾专为大模型打造,单卡支持48GB显存。MTTS4000采用了第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽,FP32性能为25TFLOPs、TF32性能为50TFLOPs、INT8性能为200TFLOPs。基于MTTS4000和双路8卡GPU服务器MCCXD800,该算力集群支持从单机多卡到多机多卡,从单卡到千卡集群的无缝扩展,未来还将推出更大规模的集群。
RTX40SUPER系列将在明年初的CES2025上登场亮相下一代的RTX50系列也有了新的说法。经常曝料的推友kopite7kimi给出的消息确认,RTX50系列旗舰卡大概率叫做RTX5090将会首发新一代显存GDDR7,和之前预测相符。GB203核心会精简到256-bit显存位宽,GB204、GB205继续降级。
近期美光公司正式发布了包括GDDR7和HBM4E内存技术在内的显存路线图。图源备注:图片由AI生成,图片授权服务商Midjourney目前美光最高规格的GDDR6X显存最高运行带宽为24Gbps,显存容量为16GB。在内存方面,美光将在2024年中推出LPCAMM2内存,带宽为8533Mbps;到2026年将推出带宽为9600Mbps的LPCAMM2内存。
BlackwellRTX50系列要到2025年才会发布,因此在明年我们将看到SUPER系列回归,至少包括有RTX4080SUPER、RTX4070TiSUPER、RTX4060SUPER三款型号。根据最新曝料,RTX4080SUPER将会把AD103芯片升级为AD102,CUDA核心数量必然增加但具体不详显存将从256-bit16GBGDDR6X升级到320-bit20GBGDDR6X。接下来就看RTX4070TiSUPER怎么升级了,看起来必然也会是256-bit16GB。
三星在日前举办2023年三星内存技术日”上,再次更新了关于其GDDR7显存的技术信息。自去年10月份三星正式公布GDDR7显存以来,就一直受到了广泛关注,如今三星带来了关于该技术更多的细节和改进。除了36Gbps的GDDR7显存外,三星还展示了速度更高的显存样品,但目前还不清楚后期能都实现商业化。
NVIDIA在8月份发布的RTX5000/6000ADA工作站专业卡,如今终于在国内电商上架了。不过价格不美丽,售价来到了35999元。在加速渲染、AI、图形和计算工作负载性能方面,RTX5000Ada可以带来卓越的性能表现。
按照路线图,NVIDIA将在2025年推出下一代BlackwellGPU架构,并且花开两朵:GB100系列核心面向高性能计算、人工智能,GB200系列核心面向游戏、创作。根据权威曝料高手kopite7kimi的最新消息,GB100大核心将配备10组GPC,每组GPC又分为8组TPC。它下边还会有GB203、GB205、GB206、GB207等四个不同级别的核心。
育碧公布了其新作《刺客信条:幻景》的游戏配置要求。该游戏将支持英伟达的DLSS、AMD的FSR和英特尔的XeSS采样技术。消息来源还分享了该游戏在不同画质下的显存占用情况。
讯景日前推出了AMDRadeonRX6800显卡,现在这款显卡已经来到我们评测室,下面为大家带来图赏。讯景RX6800采用正面三风扇的设计,左右两个直径100mm,中间92mm几乎布满了显卡正面,13叶片的风扇增加了总气流,高负载轻松温控。RX6800的性能到现在还是非常能打的,尤其是在价格上比RTX4060Ti16GB还要便宜了400元左右。
大模型的训练和微调对显存要求很高,优化器状态是显存主要开销之一。清华大学朱军、陈键飞团队提出了用于神经网络训练的4比特优化器,节省了模型训练的内存开销,同时能达到与全精度优化器相当的准确率。我们也提供了修改量化参数的接口,以支持定制化的使用场景。
随着大模型规模的不断增大,显存需求成为模型训练的主要瓶颈之一。优化器状态中的一阶矩和二阶矩是占用大量显存的重要因素。这些成果将促进大模型在有限硬件条件下的高效训练与应用。
一、前言:RX7000系列最后的拼图不可否认,NVIDIA这一代的RX40系GPU是极为成功的,但也并不是说它的产品线就没有缺陷。比如RTX4060Ti,这是NVIDIA历史上唯一一张打不过上一代70的60Ti显卡,但售价却比前代还贵了400元。现在我们还不能确定RX7800XT与RTX4070之间谁更强,但是可以肯定的是,RX7700XT必然会对RTX4060Ti形成碾压性的性能优势。
玩AI画画,现在终于不用担心被老黄刀法“背刺”了!只需要一块4年前的GTX1650,AI出图效果堪比当前最好的开源模型SDXL。这是最近在GitHub上连续数日霸榜TOP1的新项目Fooocus,三天标星破4k,ControlNet作者出品。在社交媒体上,已经有网友自发整出了Fooocus版不同风格的提示词合集Excel。
RTX4060Ti16GB是一款争议性很大的产品,NVIDIA官方自己都相当低调,显卡厂商也都兴趣寥寥,这也不是说它毫无用处。油管博主DanielOwen就在多款新游戏中对比测试了RTX4060Ti16/8GB,结果发现在1080p、2K分辨率下,16GB显存平均领先了大约40%,4K分辨率下的优势更是平均多达1倍。DLSS对显存占用量也有影响,比如《赛博朋克2077》,2K、超高画质、光追下为8426MB,打开DLSS质量模式降至7249MB,打开DLSS3帧生成又回到8000MB。