首页 > 动态 > 关键词  > 英伟达最新资讯  > 正文

NVIDIA再次打破MLPerf基准测试的性能记录

2020-10-22 15:51 · 稿源: TechWeb.com.cn

英伟达宣布其人工智能计算平台再次打破了最新一轮MLPerf的性能记录。这反过来又扩大了该公司在业界唯一一个衡量硬件、软件和服务人工智能性能的独立基准上的领先地位。

NVIDIA在第二版MLPerf Inference中赢得了针对数据中心和边缘计算系统的所有六个应用领域的所有测试。这些测试的范围从最初的两个计算机视觉扩展到了四个,涵盖了AI增长最快的领域:推荐系统、自然语言理解、语音识别和医学成像。

各行各业的企业已经在利用NVIDIA A100 Tensor Core GPU出色的推理性能,将AI从其研究团队带入日常运营中。金融机构正在使用对话式AI来更快地回答客户问题,零售商也在使用AI来保持货架库存。另一方面,医疗保健提供者正在使用AI分析数百万幅医学图像,以更准确地识别疾病并帮助挽救生命。

MLPerf的最新结果来自NVIDIA在AI推理方面的足迹急剧增长。五年前,只有少数领先的高科技公司使用GPU进行推理。现在,通过每个主要的云端和数据中心基础设施提供商均可使用NVIDIA的AI平台,代表各行各业的公司都在使用其AI推理平台来改善其业务运营并提供其他服务。

此外,与CPU相比,NVIDIA GPU现在在公共云中首次提供了更多的AI推理能力。NVIDIA GPU的云AI推理计算能力每两年大约增长10倍。

NVIDIA将AI推论推向新的高度

NVIDIA及其合作伙伴使用NVIDIA的加速平台提交了MLPerf 0.7结果,该平台包括NVIDIA数据中心GPU、Edge AI加速器和NVIDIA优化软件。

NVIDIA A100于今年早些时候推出,采用了第三代Tensor内核和多实例GPU技术,在ResNet-50测试中提高了领先优势,在上一轮中以30倍的优势击败了CPU,而现在其性能已提高了6倍。此外,根据MLPerf Inference 0.7基准测试,在针对数据中心推理的最新推荐测试中,A100的性能比最新CPU高出237倍。

这意味着单个NVIDIA DGX A100系统可以提供与大约1000个双插槽CPU服务器相同的性能,从而使客户在将AI推荐器模型从研究应用于生产时可以实现极高的成本效益。

基准测试还表明,NVIDIA T4 Tensor Core GPU仍然是主流企业,边缘服务器和具有成本效益的云实例的可靠推理平台。在相同的测试中,NVIDIA T4 GPU比CPU高出28倍。此外,NVIDIA Jetson AGX Xavier是基于SoC的边缘设备中的性能领导者。

要获得这些结果,需要高度优化的软件堆栈,包括NVIDIA TensorRT推理优化器和NVIDIA Triton推理服务软件,这两种软件都可以在NVIDIA的软件目录NGC上找到。

除了NVIDIA自己提交的文件外,还有11个NVIDIA合作伙伴使用NVIDIA GPU提交了总共1,029个结果,占数据中心和边缘类别提交的文件总数的85%以上。

举报

  • 相关推荐
  • NVIDIA明年上马3nm!私人定制 但不是游戏卡

    NVIDIA将在明年推出采用台积电3nm级工艺的下一代高性能计算GPUBlackwellGB100,以及下一代加速卡B100。NVIDIA现有的GH100GPU使用的是台积电4nm工艺是定制版。Intel、AMD、高通等也都会纷纷升级台积电的3nm工艺。

  • NVIDIA下一代GPU架构巨变!首次上马多芯片 学习AMD/Intel

    NVIDIARTX40系列、AMDRX7000系列这一代显卡都已经布局完毕下一代还要等差不多两年,至少NVIDIABlackwell在路线图上看要到2025年才会推出明年来一波Super系列?2021年就第一个曝出Blackwell这个代号的曝料高手kopite7kimi给出的最新说法称,Blackwell不会明显增加GPC、TPC等计算单元的数量,CUDA核心数自然也不会大幅提升,但是会在基础架构上做出巨大的革新。GB20x系列游戏卡核心,应该还是单芯片,这倒是和AMDNavi31/32不一样。

  • 美国最受欢迎CEO榜单出炉:NVIDIA黄仁勋夺魁 库克仅第四

    据美国科技公司职场社区Blind调查,NVIDIACEO黄仁勋成为美国最受员工欢迎的CEO,支持率高达96%。今年8月,Blind面向硅谷科技员工展开了全美CEO支持率调查,共有13171名美国员工进行了匿名投票。AMDCEO苏姿丰支持率为79%,排在第八。

  • NVIDIA官方自曝下下代GPU:2025年这么着急?

    NVIDIA最近在一份面向投资者的演示文件中,意外披露了下下代GPU架构的路线图。NVIDIA目前有两种截然不同的GPU架构,一是面向消费级游戏和图形的AdaLovelace,二是面向高性能计算和人工智能的Hopper。Blackwell架构在此前路线图上要到2024年才会登场再下代2025年就推出,时间过于紧凑,所以这个X架构的定位可能会有所不同。

  • Nvidia第二季度交付900吨AI芯片 Meta可能是最大单客户

    根据Omdia研究公司称,芯片巨头Nvidia在第二季度交付了900吨其旗舰型号H100GPU的AI芯片,这一庞大的交付量主要是由于对其AI芯片需求的急剧增加。Omdia报告指出,大量的GPU正涌入超大规模数据中心,这对服务器的出货量造成了不利影响。这是因为领域特定的AI模型具有“显著较少”的参数、数据集大小、标记和时代,这是根据研究公司的观察得出的结论。

  • A轮获NVIDIA领投1亿美元融资,大模型先驱和斯坦福教授用AI颠覆制药业

    AI生物医药领域,DeepMind的AlphaFold是最出名的研究,它几乎完整解析了所有蛋白质结构。AlphaFold的AI系统基于Transformer架构Transformer论文主要的作者JakobUszkoreit也已投身AI医药领域。数据安全的逻辑下,很可能诞生一批中国本土的AI药物研发和AI医疗健康创业公司,十分值得期待。

  • Getty Images与Nvidia合作开发生成式AI图片工具

    图片库巨头GettyImages与芯片制造商Nvidia宣布合作,共同开发生成式AI图片工具。这一消息引发了有关图片创作者应该获得图片创作权的争议。这一合作引发的争议将继续推动我们思考和探讨AI技术如何塑造我们的文化和创意产业,以及如何平衡技术的创新和创作者的权益。

  • 24GB HBM3E内存明年初交付:NVIDIA疯狂堆料282GB!

    将在明年初大批量出货交付HBM3E高带宽内存,首要客户就是NVIDIA。NVIDIAA100/H100计算卡热卖,对于HBM的需求也空前高涨,动辄单卡几十GB,最近宣布的GraceHopper超级芯片,双路系统就需要282GBHBM3E。美光还将在明年初出货32GBDDR5颗粒,可以轻松做成单条桌面32GB、服务器128GB,甚至能达成单条1TB。

  • NVIDIA RTX 5000 Ada工作站显卡现身国内电商:32GB显存 价格35999元

    NVIDIA在8月份发布的RTX5000/6000ADA工作站专业卡,如今终于在国内电商上架了。不过价格不美丽,售价来到了35999元。在加速渲染、AI、图形和计算工作负载性能方面,RTX5000Ada可以带来卓越的性能表现。

  • Chat Video:用GPT分析和总结视频

    ChatVideo是一个基于人工智能的视频分析和管理工具,致力于帮助用户高效学习和管理视频。在这个视频泛滥的时代,ChatVideo凭借其独特的AI技术,为用户节省大量时间,真正释放视频的价值。如果你希望高效管理视频,ChatVideo一定是你的最佳选择。