AMD 刚刚发布了基于 Aldebaran GPU 架构的 Instinct MI200加速卡,同时它也是该公司旗下首款6nm 多芯片封装(MCM)产品。规格方面,可知基于 CDNA2架构的 Instinct MI200拥有580亿个晶体管、超过14000个内核、以及高达128GB 的 HBM2e 显存,FP32性能更是达到了惊人的95TFLOPs 。
AMD 指出,CDNA2内核可加速 FP64和 FP32矩阵运算,FP64理论峰值性能最高可达上一代的4倍。
得益于业内领先的2.5D Elevated Fanout Bridge(EFB)封装技术,AMD 首创的多芯片 GPU 设计,在内核数量上达到了上一代的1.8倍、内存带宽达到了2.7倍,聚合理论峰值内存带宽也高达3.2TB/s 。第三代 Infinity Fabric 技术可管理多达8条 Infinity Fabric 链路,将 AMD Instinct MI200计算节点与三代霄龙(EPYC)处理器和其它 GPU 连接起来,以实现统一的 CPU / GPU 一致性、并最大限度地提升系统吞吐量。
据悉,AMD Instinct MI200内部是一块 Aldebaran GPU,并且可进一步细分为主 / 副两部分芯片。每个芯片有8组着色器引擎(总共16组 SE),且每 SE 包含16个具有全速率 FP64/ FP32/ 二代矩阵引擎的 CU(用于 FP16/ BF16操作)。每个芯片 die 上拥有128计算单元(CU)/8192个流处理器,总计可轻松达成220计算单元 /14080个留处理器,辅以新颖的 XGMI 内部互联设计、且每个小芯片具有 VCN2.6引擎 / 主 IO 控制器。
AMD Instinct MI200系列加速器基于 AMD CDNA2架构,可为广泛的高性能计算(HPC)工作负载提供业内领先的应用程序性能。
其中 MI250X 型号提供4.9X 倍于竞品的 FP64性能,以及超过380万亿次的理论峰值半精度(FP16)浮点运算性能,可极大推动 AI 等数据驱动的研究工作。
性能方面,AMD Instinct MI200也超越英伟达 A100解决方案,并打破了多项纪录,比如高达3X 的 AMG 性能。
DRAM 方面,AMD 采用了1024-bit @8通道接口,总计8192-bit 总线位宽,且每个接口可支持2GB HBM2e 缓存。
每个堆栈具有高达16GB 的 HBM2e 缓存,最大可达128GB 。相比之下,英伟达 A100平台只有80GB HBM2e 缓存。
AMD Instinct MI200的显存速率也达到了3.2Gb/s,总带宽3.2TB/s,较2TB/s 的英伟达 A10080GB 型号还领先1.2TB/s 。
目前已知的是,AMD Instinct MI200将为三台顶级超算提供支持,包括美国百亿亿级 Frontier 系统、欧盟 pre-exascale LUMI 系统、以及澳大利亚千万亿级 Setonix 系统。
最后,AMD 为 Instinct MI200系列 GPU 加速卡提供了三种配置选项,包括 OAM 形式的 MI250/ MI250X、以及双槽 PCIe 形式的 MI210。
(举报)