首页 > 业界 > 关键词  > NVIDIA显卡最新资讯  > 正文

售价超25万元 NVIDIA显卡H100刷新AI跑分记录:近30倍领先

2023-06-28 10:15 · 稿源: 快科技

快科技6月28日消息,AI火爆之后,NVIDIA的显卡成为香饽饽,尤其是高端的H100加速卡,售价超过25万元依然供不应求,而它的性能也非常夸张,最新的AI测试中全面刷新记录,基于GPT-3的大语言模型训练任务纪录已经被刷至11分钟。

机器学习及人工智能领域开放产业联盟MLCommons公布了最新的MLPerf基准评测,其中包括8个负载测试,LLM大语言模型中就有基于GPT-3开源模型的,很考验平台的AI性能。

参与测试的NVIDIA平台由896个Intel至强8462Y 处理器和3584个H100加速卡组成,是所有平台中唯一跑完所有测试的,而且刷新了记录。

在关键的基于GPT-3的大语言模型训练任务中,H100平台只用了10.94分钟,可以对比的是Intel平台,由96个至强8380处理器和96个Habana Gaudi2AI芯片构建的系统中,完成同样测试的时间为311.94分钟。

H100平台的性能几乎是30倍于Intel平台,当然两套平台的规模相差也很大,但只用768个H100加速卡的话,训练时间也只要45.6分钟,依然远超Intel平台的AI芯片。

售价超25万元 NVIDIA最强显卡H100刷新AI跑分记录:近30倍领先

H100基于GH100GPU核心,定制版台积电4nm工艺制造,800晶体管,集成18432个CUDA核心、576个张量核心、60MB二级缓存,支持6144-bit HBM高带宽内存,支持PCIe5.0。

H100计算卡有SXM、PCIe5.0两种样式,其中SXM版本15872个CUDA核心、528个Tensor核心,PCIe5.0版本14952个CUDA核心、456个Tensor核心,功耗最高达700W。

性能方面,FP64/FP3260TFlops(每秒60万亿次),FP162000TFlops(每秒2000万亿次),TF321000TFlops(每秒1000万亿次),都三倍于A100,FP84000TFlops(每秒4000万亿次),六倍于A100。

举报

  • 相关推荐
  • AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

    本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 雷军晒第100次健身打卡 提前3个月完成健身目标

    小米集团CEO雷军于9月28日宣布,已提前3个月完成2025年健身打卡100次的目标,展现出自律精神。他在跨年直播中曾提出三大新年愿望,包括健身、交付30万辆小米汽车及旅行。今年以来,雷军平均每月健身超10次,坚持践行承诺,引发网友热议。此举不仅树立积极榜样,也引发市场对小米拓展健身领域的关注与猜测。

  • 迅雷游戏加速器国庆特惠|首充低至3.2折,额外加赠月卡或周卡!

    迅雷游戏加速器推出国庆专属福利活动:9月28日至10月14日期间,新用户首充可享3.2折优惠,24元即可开通3个月会员,额外加赠周卡;老用户续费可获赠1个月会员。活动还提供闪电币奖励及抽3A游戏机会,覆盖全平台超5000款游戏加速服务,有效解决延迟、卡顿问题,助力玩家畅享假期游戏体验。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 真我GT8 Pro镜头模组支持DIY!可拆、可拼、可换

    真我GT8+Pro手机公布镜头模组创新设计,采用可拆卸、可拼装、可更换的Deco模块,提供圆形、方形及机器人造型供用户DIY。搭载2亿像素潜望长焦“Ultra之眼”,配备对称双扬声器、X轴线性马达及3D超声波屏下指纹。全系配备2K+144Hz京东方Q10+发光材料屏幕,峰值亮度达4000nit。首批搭载骁龙8至尊版处理器,并配备电竞独显芯片R1,实现“王炸双芯”配置。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • 给摄影加点创意 3000元档唯一半画幅微单佳能EOS R100体验

    文章介绍佳能EOS R100微单相机,价格约3000元,性价比高。配备2410万有效像素,支持高精细照片和4K视频拍摄。机身仅重309克,轻便易携。通过手机App可远程操控,方便取景和自拍。内置创意滤镜功能,如颗粒黑白效果,适合即时分享。文章还提供多种创意拍摄技巧,如利用反光物体拼接空间、减法构图突出主体、慢门拍摄表现时间差异、光影运用增强画面立体感。鼓励多拍多�

今日大家都在搜的词: