首页 > 业界 > 关键词  > amd最新资讯  > 正文

AMD Instinct MI200加速卡或拥有110组计算单元:MCM GPU架构加持

2021-09-02 10:50 · 稿源: cnbeta

Coelacanth's Dream 刚刚在 GitHub 上发现了一份近期提交的代码,可知其中揭示了有关即将到来的基于 AMD Aldebaran GPU 的 Instinct 加速卡的一些细节。据悉,代号为“GFX90A”的该系列 GPU 将采用 CDNA 2 架构,同时它也是 GFX 9th Family(Vega 家族)的衍生型号。

(图 via WCCFTech)

其中包括了 GFX906_60、GFX908_120 和 GFX90A_110 三个代码,预计分别对应 Instinct MI60、MI100、以及新一代 HPC 加速器 SKU 。

从型号命名规则上来看,猜测 MI60 / MI100 分别拥有 60 / 120 组计算单元(CU)。奇怪的是,GFX90A_110 的计算单元竟然比 MI100 更少。

(截图 via VideoCardz)

虽然有消息称 Aldebaran GPU 将拥有 128 组 CU,但这与我们看到的有关 AMD 下一代 Instinct 加速卡的规格有些不符。

不过考虑到厂商会按需屏蔽部分瑕疵单元(渲染引擎 / 计算单元),我们对 110 CU 的 GPU SKU 也并不感到意外。

Coelacanth's Dream 预计:MI200 的 Aldebaran GPU 采用了双拼的 MCM 设计,每边都有 56 个 CU 。分别屏蔽其中一个的话,就组成了 110 个。

目前尚不清楚 AMD 是否计划将 CDNA 2 架构上的 FP32 内核数量增加一倍。

假使该公司这么做,那下一代 Instinct 计算卡有望在 1500 MHz 的时钟频率下,达成 42.2 TFLOPs 的单精度算力(即 MI100 的 1.82 倍)。

若没有这么做,则 MI200 需要将 GPU 频率至少提升至 1650 MHz,才能达到 23 TFLOPs 的 FP32 吞吐量。

不过对于 MI200 之类的 HPC 加速卡来说,FP64 的性能显然更加重要。由早前泄露的消息可知,MI200 将具有全速率的 FP64 性能,意味其性能可达到 MI100 的两倍或四倍(具体取决于选用了怎样的架构设计)。

如果一切顺利,AMD 或在 2021 年底前发布 MI200 。作为该公司革命性的 MCM 多芯片 HPC 加速卡,它还将板载 128GB 的 HBM2e 高带宽缓存。

举报

  • 相关推荐
  • 古怪加速器两周年 永久时长卡免费送 错过手慢无

    古古怪怪加速器迎来两周年庆,推出超值福利:全场套餐最低六折起,买一送一更划算。参与活动可抽永久时长卡,最高得500小时SVIP。加速器每日免费16小时可暂停,拥有海量海外节点,内置掉线保护、多线切换等功能,解决游戏卡顿延迟问题。内置帧数大师等工具提升游戏流畅度,搭配AI优化降低电脑温度。现在打开即可领20小时免费时长,机不可失!

  • IBM与Anthropic达成战略合作,为企业软件开发注入AI赋能的安全和治理

    IBM与Anthropic达成战略合作,将Claude大语言模型集成至IBM软件产品及开发工具中,旨在加速企业级AI开发进程。该合作聚焦提升开发效率,在IBM全新AI集成开发环境中率先应用,支持代码生成、测试部署等全生命周期任务。内部测试显示生产力提升45%,同时确保代码质量与安全合规。双方强调将为企业提供安全可靠的AI解决方案,推动行业标准化发展。

  • “全球Robotaxi第一股”文远知行:港股上市临近,商业化进程加速

    文远知行通过港交所聆讯,正式进入港股上市冲刺阶段,将构建“美股+港股”双资本平台。作为全球自动驾驶标杆企业,其产品已在7个国家获自动驾驶牌照,在11国30城开展测试运营,安全运营超2200天。技术层面,预测算法误差控制在0.2米内,感知模型延迟小于10毫秒,系统检测精度达99%。成本大幅下降,单车成本降至几十万元,二季度营收同比增长60.8%,自动驾驶网约车业务猛增836.7%。近期获准在北京开展夜间道路测试,向全天候服务网络迈出关键一步。随着技术成熟与商业模式验证,万亿级自动驾驶市场正迎来规模化运营拐点。

  • 技嘉发布X3D系列主板:专为AMD X3D处理器打造,游戏性能提升高达25%

    技嘉推出专为AMD Ryzen X3D处理器优化的X870E AORUS X3D系列主板,首发型号包括MASTER与PRO两款。该系列搭载X3D鸡血模式2.0技术,通过AI智能场景识别可自动优化处理器性能,游戏性能最高提升25%。主板采用全快易拆设计,配备免螺丝M.2插槽、磁吸散热装甲及一键拆卸显卡插槽。集成AI黑科技2.0支持DDR5内存超频至9000MT/s+,预装网卡驱动实现开机即联网。两款主板均提供4年质保(含1年免费换新),现已在各大电商平台上市。

  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

  • 【CIM 加速,AI有方】No.2|格创东智GT Insights用AI工作流改写半导体智造决策范式

    在半导体制造领域,数据驱动的精准决策成为提升良率、降低成本的核心。传统数据分析系统面临三大挑战:技术门槛高、分析周期长、知识传承难。格创东智推出的GT+Insights产品,通过自然语言交互实现“对话即分析”,大幅降低使用门槛。该系统采用语义建模技术,将复杂物理数据转化为业务友好模型,支持分钟级全链路良率根因分析。目前已在多家半导体企业成功落地,助力客户显著提升生产效率,推动行业向智能化持续迈进。

  • 前B站副总裁打造“非共识”AI陪伴,国内拿下千万用户后加速出海

    在今年东京电玩展的现场,我们第一次见到了 AI 陪伴创企心影随形的创始人刘斌新。 面前的刘斌新,像此前媒体同行描述的一样随和、健谈,他曾先后出任过百度副总监、360助理总裁、B 站副总裁,2023年,他选择了自己创业,从熟悉的游戏场景切入做一款 AI 陪伴产品,「逗逗游戏伙伴」由此诞生。 从整个 AI 陪伴品类来看,「逗逗游戏伙伴」是一个很“特别”的存在。不同�

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

  • 边看边买?红果内测“搜同款”,加速短剧电商变现

    ​短剧还能带货? 近日,红果短剧被曝内测短剧带货功能。用户在红果观看短剧时,暂停观看时会弹出“搜同款”提示,点击后页面显示商品链接。用户无需跳转抖音,在红果站内便可直接完成购买。 这一功能目前已覆盖红果上几乎所有短剧,包括《盛夏芬德拉》《好一个乖乖女》《家里家外》等新老剧集。 加入电商功能,意味着红果的变现路径再度拓宽;另一方面,

今日大家都在搜的词: