首页 > 业界 > 关键词  > HBM2e高带宽最新资讯  > 正文

性能暴涨4.5倍!NVIDIA H100计算卡强势垄断AI:对手?不存在

2023-04-06 17:15 · 稿源: 快科技

AI世界如今最大的赢家是谁?

毫无疑问是黄仁勋的NVIDIA,布局早,技术强,根本找不到对手,躺着”就可以挣大钱了。

现在,NVIDIA又公布了最新一代Hopper H100计算卡在MLPerf AI测试中创造的新纪录。

Hopper H100早在2022年3月就发布了,GH100 GPU核心,台积电4nm工艺,800亿晶体管,814平方毫米面积。

它集成18432个CUDA核心、576个Tensor核心、60MB二级缓存,搭配6144-bit位宽的六颗HBM3/HBM2e高带宽内存,支持第四代NVLink、PCIe 5.0总线。

相比于ChatGPT等目前普遍使用的A100,H100的理论性能提升了足足6倍。

不过直到最近,H100才开始大规模量产,微软、谷歌、甲骨文等云计算服务已开始批量部署。

性能暴涨4.5倍!NVIDIA H100计算卡强势垄断AI:对手?不存在

性能暴涨4.5倍!NVIDIA H100计算卡强势垄断AI:对手?不存在

MLPerf Inference是测试AI推理性能的行业通行标准,最新版本v3.0,也是这个工具诞生以来的第七个大版本更新。

对比半年前的2.1版本,NVIDIA H100的性能在不同测试项目中提升了7-54%不等,其中进步最大的是RetinaNet全卷积神经网络测试,3D U-Net医疗成像网络测试也能提升31%。

性能暴涨4.5倍!NVIDIA H100计算卡强势垄断AI:对手?不存在

对比A100,跨代提升更是惊人,无延迟离线测试的变化幅度少则1.8倍,多则可达4.5倍,延迟服务器测试少则超过1.7倍,多则也能接近4倍。

其中,DLRM、BERT训练模型的提升最为显著。

NVIDIA还颇为羞辱性地列上了Intel最新数据中心处理器旗舰至强铂金8480 的成绩,虽然有56个核心,但毕竟术业有专攻,让通用处理器跑AI训练实在有点为难,可怜的分数不值一提,BERT 99.9%甚至都无法运行,而这正是NVIDIA H100的最强项。

性能暴涨4.5倍!NVIDIA H100计算卡强势垄断AI:对手?不存在

此外,NVIDIA还第一次公布了L4 GPU的性能。

它基于最新的Ada架构,只有Tensor张量核心,支持FP8浮点计算,主要用于AI推理,也支持AI视频编码加速。

对比上代T4,L4的性能可加速2.2-3.1倍之多,最关键的是它功耗只有72W,再加上单槽半高造型设计,可谓小巧彪悍。

几乎所有的大型云服务供应商都部署了T4,升级到L4只是时间问题,Google就已经开始内测。

举报

  • 相关推荐
  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 纸嫁衣如何借助Sigmob实现IAA广告变现的高效平衡?

    随着中国游戏市场发展,移动解谜游戏成为重要娱乐方式。《纸嫁衣》系列凭借传统文化融合与沉浸式体验成为国产解谜游戏代表IP。其采用IAA商业模式,核心挑战在于平衡广告体验与剧情沉浸感。团队与Sigmob长期合作,通过精细化运营实现用户体感与广告收益双赢。具体策略包括:用户行为驱动的广告触发机制、智能投放技术优化填充率与eCPM、分阶段动态调优策略(冷启动期快速扩量、成长期构建用户特征库、成熟期结合频控提升收益)。合作使广告收益稳步增长,CPM持续提升,为解谜类游戏商业化提供了“场景化+轻量级+用户主动型”广告设计的新思路,未来将继续探索多元化变现模式。

  • 曝MacBook塞进iPhone处理器:售价亲民

    分析师郭明錤透露,苹果MacBook系列新品规划:2026年底量产OLED版MacBook Pro,配备触控面板;2025年Q4推低价版MacBook,搭载iPhone同款A18 Pro处理器,目标年轻用户,配13英寸屏和多彩外壳,支持AI任务。苹果希望通过低价产品扩大市场份额。

  • 9月25日发布!小米17系列三款机型配置、售价曝光:全系标配骁龙8E5 全系256GB起步

    小米17系列将于9月25日晚19点正式发布,包含标准版、Pro、Pro Max和Ultra四款机型。全系搭载骁龙8E5处理器,256GB存储起步。标准版主打续航和快充,Pro系列聚焦影像和屏幕技术,Ultra定位高端探索。外观采用6.3英寸纯平直屏,超窄边框设计,整机轻薄至8.06mm/191g。售价区间从4.5K至7K档位,延续小米旗舰的高性价比策略。

  • 数据驱动未来:宜选网定义移动外贸B2B新篇章

    移动互联网已成为外贸B2B领域的核心引擎。宜选网凭借每月超6000万海外买家访问量,稳居全球移动外贸B2B平台首位。平台通过AI驱动、视频采购和多语言服务,连接全球150多个国家的400多万家中小企业,重塑外贸交易效率与成本结构。其移动端技术布局、视频会议系统和AI客服等创新,显著提升用户体验和订单转化。未来,平台将继续深化AI与移动端融合,助力中国制造业全球化发展。

  • 小米开启澎湃OS 3 Beta版最新招募:支持小米14、K70等机型

    小米澎湃OS 3 Beta版于9月24日启动招募,覆盖MIX Fold 4、MIX Flip、小米14 Ultra、14 Pro及钛金属版(卫星通讯)、小米14、Redmi K70系列四款机型和小米平板6S Pro 12.4共12款设备。招募采用分批推送机制,每机型设两批次,首批满员后启动第二批,入选用户优先获得更新。正式版将于10月15日推送,逐步扩大覆盖。该系统基于自研底层内核,通过深度优化微架构流水线,精准识别CPU空转,配合一体化调频技术,整体任务执行效率提升19%,带来更流畅体验。此次招募既为用户提供抢先体验机会,也通过反馈助力系统优化,强化小米生态竞争力。

  • 无视乔布斯意愿!曝苹果触摸屏MacBook Pro明年量产:19年来首次

    苹果首款支持触控屏的MacBook Pro预计2026年底量产,采用OLED屏幕和on-cell触控技术。这与乔布斯2010年反对触控屏Mac的立场形成对比,当时他认为垂直触控表面"从人体工程学角度非常糟糕"。2025年底将推搭载iPhone处理器的廉价版MacBook,但不支持触控;第二代或于2027年加入触控功能。这一转变基于对iPad用户习惯的观察,认为触控输入能提高生产力。此前2023年已有类似消息透露苹果工程师正积极研发触控Mac。

  • 当“极速打样”遇上“超高多层”:嘉立创如何定义PCB研发新基建?

    艾媒咨询报告显示,AI服务器和汽车电子正重塑PCB技术门槛。AI服务器要求20-30层高多层板,需应对信号完整性、热管理和超低损耗材料挑战;汽车电子则强调高可靠性,需在极端环境下稳定工作。面对复杂设计需求,传统开发流程已难应对,一站式的快速打样与高端工艺支持成为破局关键。工程师需借助能够兼顾速度与深度的制造平台,将创新设计高效转化为现实产品。

  • BOE(京东方)携手UNESCO联合主办WCBR“科学十年”分会 彰显中国科技企业可持续发展实力

    9月22日,第五届世界生物圈保护区大会在杭州开幕,这是该会议首次在中国及亚太地区举办。BOE(京东方)作为首个支持联合国“科学十年”倡议的中国科技企业,携手联合国教科文组织联合主办“科学十年”分会,展示其以技术创新赋能非洲等欠发达地区科学发展的实践成果。会议期间,BOE通过“Windows to STEM”倡议推动非洲STEM教育能力建设,并发布可持续发展品牌“ONE”,彰显其全球化布局与可持续发展理念。未来,BOE将持续携手全球伙伴践行可持续发展,为全球科学普及与绿色低碳贡献力量。

今日大家都在搜的词: