MLPerf基准测试

【新智元导读】黄老板又赢麻了!在最新的MLPerf基准测试中，H100成功创下8项测试纪录。如果迫不得已，英伟达还可以从旧的Turing版本中拿出一个产品，更新AdaLovelace，给它封个「Super」待遇，进一步扩展Ada阵容。ZhiyeLiu表示，至少今年或明年，Lovelace架构不会真正更新。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“MLPerf基准测试”的相关热搜词：

相关“MLPerf基准测试” 的资讯100篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
11分钟训完GPT-3！英伟达H100 横扫MLPerf 8项基准测试，下一代显卡25年发布

【新智元导读】黄老板又赢麻了!在最新的MLPerf基准测试中，H100成功创下8项测试纪录。如果迫不得已，英伟达还可以从旧的Turing版本中拿出一个产品，更新AdaLovelace，给它封个「Super」待遇，进一步扩展Ada阵容。ZhiyeLiu表示，至少今年或明年，Lovelace架构不会真正更新。

MLPerf基准测试 H100 消费级显卡
浪潮AI服务器创全球权威MLPerf基准测试18项AI性能纪录

美国东部时间10月21日，全球备受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单，浪潮AI服务器NF5488A5一举创造18项性能纪录，在数据中心AI推理性能上遥遥领先其他厂商产品。MLPerf是当前全球最具影响力的AI计算基准评测组织，由图灵奖得主大卫·帕特森（David?Patterson）联合谷歌、斯坦福、哈佛大学等单位共同成立，每年组织全球AI训练和AI推理性能测试并发榜。此次MLPerf的AI推理基准测试有全球23家公司和单位参与，在数据?

浪潮AI服务器
NVIDIA再次打破MLPerf基准测试的性能记录

英伟达宣布其人工智能计算平台再次打破了最新一轮MLPerf的性能记录。这反过来又扩大了该公司在业界唯一一个衡量硬件、软件和服务人工智能性能的独立基准上的领先地位。NVIDIA在第二版MLPerf Inference中赢得了针对数据中心和边缘计算系统的所有六个应用领域的所有测试。这些测试的范围从最初的两个计算机视觉扩展到了四个，涵盖了AI增长最快的领域：推荐系统、自然语言理解、语音识别和医学成像。各行各业的企业已经在利用NVIDIA

英伟达
MLPerf放榜！AI芯片公司墨芯人工智能再夺MLPerf大模型推理三项冠军

最新MLPerf推理测试结果公布，墨芯人工智能再次夺冠，其S30计算卡在GPT-J大模型的单卡、4卡、8卡推理性能均位居第一。此前墨芯已在MLPerf上连续两届夺冠。MLPerf成绩是对墨芯产品实力的肯定，也印证稀疏计算将助力大模型算力实现根本性变革。

墨芯 AI芯片
荐 AI视野：英伟达GH200在MLPerf 3.1中惊艳亮相；作家集体起诉OpenAI侵犯版权；蚂蚁集团发布“蚁天鉴”大模型安全一体化解决方案

9月12日，淘天集团联合爱橙科技正式对外开源大模型训练框架Megatron-LLaMA，以提高大语言模型训练性能，降低训练成本。蚂蚁集团发布“蚁天鉴”大模型安全一体化解决方案蚂蚁集团在2023国家网络安全宣传周上发布了名为“蚁天鉴”的大模型安全一体化解决方案，包括“蚁鉴2.0”大模型安全检测平台和“天鉴”大模型风险防御平台，可以从多角度保障大模型的安全性。sdxl-emoji:

英伟达
英伟达GH200在MLPerf 3.1中惊艳亮相，性能相比H100跃升17%

MLPerf作为业界公认的AI系统性能基准测试，最近发布了3.1版本。英伟达最新发布的GH200GraceHopper超级芯片首次在公开基准中亮相。未来的软件优化将进一步释放这些模块中的英伟达OrinSoC的强大潜力。

英伟达GH200
英伟达 H100 在 MLPerf AI 性能测试刷新纪录：11 分钟不到完成 GPT-3 大模型训练

MLPerf基准测试是评估系统在一系列人工智能工作负载下的性能表现的重要指标。人工智能正在快速发展，生成式人工智能工作负载日益突出MLPerf也在与行业一起不断进化。英伟达不再只是我们成长过程中的游戏图形公司是迅速成为我们集体未来的关键推动者。

英伟达 InflectionAI 人工智能
MLPerf最新发榜，浪潮AI服务器囊括数据中心推理全部冠军

相比半年前的MLPerf™AI推理榜单V1.1，浪潮AI服务器将图像分类、语音识别和自然语言理解任务的推理性能分别提升31.5%、28.5%及21.3%，意味着浪潮AI服务器在自动驾驶、语音会议、智能问答和智慧医疗等等场景中，能够更高效快速地完成各类智能任务...本次参与测评的浪潮AI服务器NF5468M6J拥有出色的系统设计，以分层可扩展计算架构在业界率先实现对 12 颗NVIDIA A100 Tensor Core GPU的支持，并以极佳的性能成绩一举揽获 12 项冠军......

浪潮信息自然语言理解数据中心
Surface 3基准测试：追不上Surface Pro 3略胜Surface 2

Windows 平板 surface
Check Point 在零信任平台基准测试中拔得头筹

CheckPointInfinity平台被评为领先的零信任安全解决方案，可提供卓越的用户体验和可靠的安全性。2024年3月，领先的云端AI网络安全平台提供商CheckPoint®软件技术有限公司近日宣布，其CheckPointInfinity平台在最新的Miercom零信任平台评估中排名第一。Miercom提供包括竞争性产品分析和产品评估在内的专有测试服务，拥有全面的认证和测试方案。

Check Point Infinity
Check Point在Miercom 2024年下一代防火墙基准测试报告中大获全胜

CheckPoint实现了99.8%的新型恶意软件拦截率、100%的网络钓鱼防御率和0.13%的业内领先的超低误报检测率2024年2月—领先的云端AI网络安全平台提供商CheckPoint软件技术有限公司今天宣布，其CheckPointInfinity平台在Miercom的2024年下一代防火墙安全基准测试报告中表现优异，01日恶意软件拦截率和网络钓鱼防御率分别高达99.8%和100%。其他四家安全厂商的平均新型恶意软件拦截率仅为69.2%。Mie
RNN模型挑战Transformer统治地位 Eagle 7B模型登顶多语言基准测试

随着大模型的崛起，RNN模型Eagle7B挑战了Transformer的霸主地位。该模型在多语言基准测试中表现卓越，同时推理成本降低数十倍。通过不断探索和创新，人工智能技术将更好地为人类社会和个体提供服务。

大模型
Nomic AI 发布首个完全开源的长文本嵌入模型，超越 OpenAI Ada-002在各项基准测试中的表现

在自然语言处理领域不断发展的背景下，理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力，特别是通过文本嵌入的发展。它打破了在长文本嵌入领域的准入壁垒，承诺一个未来，其中对话的深度与人类讨论的广度相匹配。

Nomic AI头条
首个图像序列基准测试Mementos开源 GPT-4V/Gemini竟看不懂漫画！

马里兰大学与北卡教堂山合作发布了Mementos，这是专为多模态大语言模型设计的图像序列基准测试，旨在全面测试这些模型对于真实世界、机器人和动漫图像序列的推理能力。测试结果令人震惊，GPT-4V和Gemini等MLLM在漫画数据集上的准确率不足20%。这对于推动MLLM在图像领域的发展提出了挑战，并强调了进一步研究和优化的迫切性。

Mementos
研究揭示：谷歌Gemini Pro在基准测试中落后于免费ChatGPT

根据卡内基梅隆大学的最新研究报告，谷歌最新推出的大型语言模型GeminiPro在基准测试中未能达到预期水平，不仅落后于GPT-3.5远远不及GPT-4。GeminiPro的研究结果与谷歌在Gemini发布会上所提供的信息相矛盾，凸显了对中立基准测试机构或流程的迫切需求。尽管谷歌竭尽全力，但其在追赶OpenAI方面仍然表现不佳，对整个AI行业言并非好消息。

Gemini ChatGPT AI头条
Gemini 是谷歌迄今为止最佳的 AI 模型但充满希望的基准测试和演示最终引发了批评

谷歌近日公布了其最新的人工智能模型Gemini，旨在缩小与OpenAI之间的差距，并给行业留下深刻印象。该模型展示了强大的基准测试成绩，并通过一段引人注目的视频演示和即时的可用性，彰显了谷歌的自信。AI领域的快速发展使得人们很难预测Ultra发布时的情况，同时也给了OpenAI足够的时间来用新模型或对GPT-4的适度改进作出回应。

Gemini 谷歌人工智能
亚马逊 AWS 将提供人类基准测试团队来测试人工智能模型

亚马逊希望用户能够更好地评估人工智能模型，并鼓励更多人参与这一过程。在AWSre:Invent大会上，AWS数据库、分析和机器学习副总裁SwamiSivasubramanian宣布推出宣布Bedrock上的模型评估，现已提供预览，用于评估其存储库AmazonBedrock中的模型。Philomin表示，Bedrock上的基准测试的目标不是广泛评估模型是为公司提供一种衡量模型对其项目影响的方式。

亚马逊 AWS 人工智能
GAIA基准测试揭示人类胜过GPT-4的惊人差距

来自FAIRMeta、HuggingFace、AutoGPT和GenAIMeta的研究人员共同致力于解决通用人工智能助手在处理需要基本技能，如推理和多模态处理的现实问题上所面临的挑战。他们推出了GAIA，这是一个旨在通过定位人类级别的鲁棒性来实现人工通用智能的基准测试。发布注释问题和排行榜旨在解决自然语言处理中的开放式生成评估挑战及其他问题。

GPT-4 GAIA
GPT-4V搞不明白勾股定理！最新基准测试错误率竟高达90%

马里兰大学发布了一项重要研究，针对GPT-4V视觉模型进行了首个专为其设计的基准测试，名为HallusionBench。这项研究揭示了令人震惊的发现，即GPT-4V的错误率高达90%。这项研究对于深化我们对大型语言模型的认识，以及推动其在现实世界中的应用具有重要意义。

GPT-4V
Meta发布AI基准测试工具FACET 用于评估 AI 模型的“公平性”

Meta今天发布了一个新的AI基准测试，名为FACET，旨在评估在照片和视频中对人和物体进行分类和检测的AI模型的“公平性”。FACET由32，000张包含50，000个人标签的图像组成，这些标签由人类注释者标注。要使用该工具和数据集，开发人员必须同意不将其用于训练计算机视觉模型——只用于评估、测试和基准测试。

Meta
Salesforce新AI模型可改善数据分析 XGen-7B基准测试超越Meta的LLaMA-7B

随着对AI工具的需求增加，对能够完成更多任务的系统的需求也越来越大。企业可以通过拥有像ChatGPT或Bard这样的聊天界面来受益，这些界面能够对冗长的文件进行摘要或筛选客户数据以获取见解。这是由于模型无法处理较长的上下文长度，导致混淆和产生幻觉。

XGen-7B ChatGPT AI头条
基准测试GeekBench 6.1发布：跑分成绩提升达10%

今年年初，知名基准测试平台GeekBench发布了6.0版本，大幅调整了跑分算法。GeekBench发布了6.1版本更新，在所有平台纳入Clang16参数后，能够更为准确的反映设备的多核性能表现。具体更新内容，与更多相关信息，可前往官网页面查看。

GeekBench 基准测试平台跑分算法
苹果iPhone 14 Pro在基准测试中比三星Galaxy S23 Ultra快20%以上

三星新发布的GalaxyS23Ultra尚未完全进入市场，但该设备的基准测试表明，苹果仍然拥有世界上最快的移动处理器。根据CompareDial发现的Geekbench单核性能得分，GalaxyS23Ultra得分为1480其最接近的竞争对手iPhone14Pro得分为1874。三星GalaxyS23系列现在可以预订，一般版本定于2月17日发布。

S23Ultra S23Ultra iPhone14Pro
Check Point公司在 Miercom 新一代防火墙基准测试报告中排名最高

Check Point 实现了 99.7% 的恶意软件拦截率、99.9% 的网络钓鱼防御率和 0.1% 的超低误报检测率。2023 年 2 月，全球领先的网络安全解决方案提供商 Check Point 软件技术有限公司在其正在举行的CPX360 大会上宣布，其 Check Point Quantum 网络安全平台在 Miercom 的 2023 年新一代防火墙安全基准测试报告中获得了接近满分的得分，恶意软件拦截率和网络钓鱼防御率分别高达 99.7% 和 99.9%。我们还在性能认证方案下提供产品评估，这是业内最全面、最可靠的产品可用性和性能评估。

CheckPoint CheckPoint CheckPointQuantum
3DMark定于周三推出Speed Way DirectX 12 Ultimate基准测试工具

3DMark“Speed Way”是一项全新的 GPU 基准测试，展示了将为下一代游戏体验提供支撑的图形技术...自 2016 年发布 Time Spy 以来，3DMark 用户已经享受到了诸多免费更新 —— 包括《Time Spy Extreme》、《CPU Profile》、《Wild Life》、以及展示 DirectX 新功能的多项基准测试...拥有旧版永久许可证的客户，需要新购年度许可证才能解锁《Speed Way》......
UL Solutions更新3DMark基准测试软件支持英特尔XeSS性能评估

周三的时候，UL Solutions 介绍了3DMark 基准测试软件的一项功能更新 —— 全面支持英特尔 Xe 超级采样技术（简称 XeSS）的性能评估...Xe Super Sampling 是英特尔新推的一项图形技术，利用 AI 增强来提升性能、同时兼顾图像的保真度...首先生成基于时间抗锯齿（TAA）的画面作为基准，然后以较低的分辨率渲染 + 启用 XeSS 拉伸，结果以平均帧率的百分比来评估性能差异......
GeForce RTX 4090 CUDA基准测试显示其性能比3090 Ti提高了60%

英伟达GeForceRTX4090显卡的第一个非官方基准测试在其发布之前已经在Geekbench5数据库中被泄露...这块参与测试的GeForceRTX4090不知道这是参考创始者版还是定制的AIB设计在AMDRyzen97950XCPU平台上进行了测试，平台配备了32GBDDR5-6000DRAM...NVIDIAGeForceRTX4090的性能比RTX3090Ti高60%，在GeekbenchCUDA基准测试中比RTX3090高75%......
英特尔分享Sapphire Rapids-SP芯片的首批加速器基准测试成绩

在创新活动的第二天，英特尔放出了 Sapphire Rapids 至强可扩展芯片的首份基准测试数据...AMD 即将推出的 Zen 4 霄龙（EPYC）服务器处理器、提供了多达 96C / 192T 的选项，另有云优化的 128C / 256T 衍生 SKU...在当天晒出的这组基准测试图表中，英特尔侧重于展示 Sapphire Rapids 芯片上的各款加速器的表现，以及如何较更高核心数 AMD EPYC 竞品更智能地工作并降低能耗......

英特尔
Der8auer分享Ampere 80核Altra Max服务器CPU基准测试成绩

尽管 Ampere 的 Altra Max CPU 已经推出有段时间，但知名超频专家 Der8auer 还是决定拿一枚80核 ARM 处理器进行测试，以评估它在标准 PC 基准测试中的表现...最后，开盖表明 Ampere Altra Max Q8030CPU 采用了基于 TIM 的焊料、且芯片尺寸达到了573.75m㎡（22.5×25.5mm）......

Der8auer
PassMark基准测试：M2单线程性能超i9-12900 但综合表现略逊

PassMark 数据库刚刚迎来了首批 Apple M2 芯片的基准测试成绩，可知其表现有望于 x86 台式 CPU 一战...如图所示，Apple M2 的单线程性能得分为 4116，仅次于 i9-12900KS（4387）、i9-12900K（4212）和 i9-12900KF（4209）......

M2 PassMark 基准测试

热文

3 天
7天

MLPerf基准测试

与“MLPerf基准测试”的相关热搜词：

相关“MLPerf基准测试” 的资讯100篇

热文

站长商机