11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】黄老板又赢麻了!在最新的MLPerf基准测试中,H100成功创下8项测试纪录。如果迫不得已,英伟达还可以从旧的Turing版本中拿出一个产品,更新AdaLovelace,给它封个「Super」待遇,进一步扩展Ada阵容。ZhiyeLiu表示,至少今年或明年,Lovelace架构不会真正更新。
美国东部时间10月21日,全球备受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,浪潮AI服务器NF5488A5一举创造18项性能纪录,在数据中心AI推理性能上遥遥领先其他厂商产品。MLPerf是当前全球最具影响力的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David?Patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球AI训练和AI推理性能测试并发榜。此次MLPerf的AI推理基准测试有全球23家公司和单位参与,在数据?
英伟达宣布其人工智能计算平台再次打破了最新一轮MLPerf的性能记录。这反过来又扩大了该公司在业界唯一一个衡量硬件、软件和服务人工智能性能的独立基准上的领先地位。NVIDIA在第二版MLPerf Inference中赢得了针对数据中心和边缘计算系统的所有六个应用领域的所有测试。这些测试的范围从最初的两个计算机视觉扩展到了四个,涵盖了AI增长最快的领域:推荐系统、自然语言理解、语音识别和医学成像。各行各业的企业已经在利用NVIDIA
最新MLPerf推理测试结果公布,墨芯人工智能再次夺冠,其S30计算卡在GPT-J大模型的单卡、4卡、8卡推理性能均位居第一。此前墨芯已在MLPerf上连续两届夺冠。MLPerf成绩是对墨芯产品实力的肯定,也印证稀疏计算将助力大模型算力实现根本性变革。
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架Megatron-LLaMA,以提高大语言模型训练性能,降低训练成本。蚂蚁集团发布“蚁天鉴”大模型安全一体化解决方案蚂蚁集团在2023国家网络安全宣传周上发布了名为“蚁天鉴”的大模型安全一体化解决方案,包括“蚁鉴2.0”大模型安全检测平台和“天鉴”大模型风险防御平台,可以从多角度保障大模型的安全性。sdxl-emoji:
MLPerf作为业界公认的AI系统性能基准测试,最近发布了3.1版本。英伟达最新发布的GH200GraceHopper超级芯片首次在公开基准中亮相。未来的软件优化将进一步释放这些模块中的英伟达OrinSoC的强大潜力。
MLPerf基准测试是评估系统在一系列人工智能工作负载下的性能表现的重要指标。人工智能正在快速发展,生成式人工智能工作负载日益突出MLPerf也在与行业一起不断进化。英伟达不再只是我们成长过程中的游戏图形公司是迅速成为我们集体未来的关键推动者。
相比半年前的MLPerf™AI推理榜单V1.1,浪潮AI服务器将图像分类、语音识别和自然语言理解任务的推理性能分别提升31.5%、28.5%及21.3%,意味着浪潮AI服务器在自动驾驶、语音会议、智能问答和智慧医疗等等场景中,能够更高效快速地完成各类智能任务...本次参与测评的浪潮AI服务器NF5468M6J拥有出色的系统设计,以分层可扩展计算架构在业界率先实现对 12 颗NVIDIA A100 Tensor Core GPU的支持,并以极佳的性能成绩一举揽获 12 项冠军......
CheckPointInfinity平台被评为领先的零信任安全解决方案,可提供卓越的用户体验和可靠的安全性。2024年3月,领先的云端AI网络安全平台提供商CheckPoint®软件技术有限公司近日宣布,其CheckPointInfinity平台在最新的Miercom零信任平台评估中排名第一。Miercom提供包括竞争性产品分析和产品评估在内的专有测试服务,拥有全面的认证和测试方案。
CheckPoint实现了99.8%的新型恶意软件拦截率、100%的网络钓鱼防御率和0.13%的业内领先的超低误报检测率2024年2月—领先的云端AI网络安全平台提供商CheckPoint软件技术有限公司今天宣布,其CheckPointInfinity平台在Miercom的2024年下一代防火墙安全基准测试报告中表现优异,01日恶意软件拦截率和网络钓鱼防御率分别高达99.8%和100%。其他四家安全厂商的平均新型恶意软件拦截率仅为69.2%。Mie
随着大模型的崛起,RNN模型Eagle7B挑战了Transformer的霸主地位。该模型在多语言基准测试中表现卓越,同时推理成本降低数十倍。通过不断探索和创新,人工智能技术将更好地为人类社会和个体提供服务。
在自然语言处理领域不断发展的背景下,理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力,特别是通过文本嵌入的发展。它打破了在长文本嵌入领域的准入壁垒,承诺一个未来,其中对话的深度与人类讨论的广度相匹配。
马里兰大学与北卡教堂山合作发布了Mementos,这是专为多模态大语言模型设计的图像序列基准测试,旨在全面测试这些模型对于真实世界、机器人和动漫图像序列的推理能力。测试结果令人震惊,GPT-4V和Gemini等MLLM在漫画数据集上的准确率不足20%。这对于推动MLLM在图像领域的发展提出了挑战,并强调了进一步研究和优化的迫切性。
根据卡内基梅隆大学的最新研究报告,谷歌最新推出的大型语言模型GeminiPro在基准测试中未能达到预期水平,不仅落后于GPT-3.5远远不及GPT-4。GeminiPro的研究结果与谷歌在Gemini发布会上所提供的信息相矛盾,凸显了对中立基准测试机构或流程的迫切需求。尽管谷歌竭尽全力,但其在追赶OpenAI方面仍然表现不佳,对整个AI行业言并非好消息。
谷歌近日公布了其最新的人工智能模型Gemini,旨在缩小与OpenAI之间的差距,并给行业留下深刻印象。该模型展示了强大的基准测试成绩,并通过一段引人注目的视频演示和即时的可用性,彰显了谷歌的自信。AI领域的快速发展使得人们很难预测Ultra发布时的情况,同时也给了OpenAI足够的时间来用新模型或对GPT-4的适度改进作出回应。
亚马逊希望用户能够更好地评估人工智能模型,并鼓励更多人参与这一过程。在AWSre:Invent大会上,AWS数据库、分析和机器学习副总裁SwamiSivasubramanian宣布推出宣布Bedrock上的模型评估,现已提供预览,用于评估其存储库AmazonBedrock中的模型。Philomin表示,Bedrock上的基准测试的目标不是广泛评估模型是为公司提供一种衡量模型对其项目影响的方式。
来自FAIRMeta、HuggingFace、AutoGPT和GenAIMeta的研究人员共同致力于解决通用人工智能助手在处理需要基本技能,如推理和多模态处理的现实问题上所面临的挑战。他们推出了GAIA,这是一个旨在通过定位人类级别的鲁棒性来实现人工通用智能的基准测试。发布注释问题和排行榜旨在解决自然语言处理中的开放式生成评估挑战及其他问题。
马里兰大学发布了一项重要研究,针对GPT-4V视觉模型进行了首个专为其设计的基准测试,名为HallusionBench。这项研究揭示了令人震惊的发现,即GPT-4V的错误率高达90%。这项研究对于深化我们对大型语言模型的认识,以及推动其在现实世界中的应用具有重要意义。
Meta今天发布了一个新的AI基准测试,名为FACET,旨在评估在照片和视频中对人和物体进行分类和检测的AI模型的“公平性”。FACET由32,000张包含50,000个人标签的图像组成,这些标签由人类注释者标注。要使用该工具和数据集,开发人员必须同意不将其用于训练计算机视觉模型——只用于评估、测试和基准测试。
随着对AI工具的需求增加,对能够完成更多任务的系统的需求也越来越大。企业可以通过拥有像ChatGPT或Bard这样的聊天界面来受益,这些界面能够对冗长的文件进行摘要或筛选客户数据以获取见解。这是由于模型无法处理较长的上下文长度,导致混淆和产生幻觉。
今年年初,知名基准测试平台GeekBench发布了6.0版本,大幅调整了跑分算法。GeekBench发布了6.1版本更新,在所有平台纳入Clang16参数后,能够更为准确的反映设备的多核性能表现。具体更新内容,与更多相关信息,可前往官网页面查看。
三星新发布的GalaxyS23Ultra尚未完全进入市场,但该设备的基准测试表明,苹果仍然拥有世界上最快的移动处理器。根据CompareDial发现的Geekbench单核性能得分,GalaxyS23Ultra得分为1480其最接近的竞争对手iPhone14Pro得分为1874。三星GalaxyS23系列现在可以预订,一般版本定于2月17日发布。
Check Point 实现了 99.7% 的恶意软件拦截率、99.9% 的网络钓鱼防御率和 0.1% 的超低误报检测率。2023 年 2 月,全球领先的网络安全解决方案提供商 Check Point 软件技术有限公司在其正在举行的CPX360 大会上宣布,其 Check Point Quantum 网络安全平台在 Miercom 的 2023 年新一代防火墙 安全基准测试报告中获得了接近满分的得分,恶意软件拦截率和网络钓鱼防御率分别高达 99.7% 和 99.9%。我们还在性能认证 方案下提供产品评估,这是业内最全面、最可靠的产品可用性和性能评估。
3DMark“Speed Way”是一项全新的 GPU 基准测试,展示了将为下一代游戏体验提供支撑的图形技术...自 2016 年发布 Time Spy 以来,3DMark 用户已经享受到了诸多免费更新 —— 包括《Time Spy Extreme》、《CPU Profile》、《Wild Life》、以及展示 DirectX 新功能的多项基准测试...拥有旧版永久许可证的客户,需要新购年度许可证才能解锁《Speed Way》......
周三的时候,UL Solutions 介绍了3DMark 基准测试软件的一项功能更新 —— 全面支持英特尔 Xe 超级采样技术(简称 XeSS)的性能评估...Xe Super Sampling 是英特尔新推的一项图形技术,利用 AI 增强来提升性能、同时兼顾图像的保真度...首先生成基于时间抗锯齿(TAA)的画面作为基准,然后以较低的分辨率渲染 + 启用 XeSS 拉伸,结果以平均帧率的百分比来评估性能差异......
英伟达GeForceRTX4090显卡的第一个非官方基准测试在其发布之前已经在Geekbench5数据库中被泄露...这块参与测试的GeForceRTX4090不知道这是参考创始者版还是定制的AIB设计在AMDRyzen97950XCPU平台上进行了测试,平台配备了32GBDDR5-6000DRAM...NVIDIAGeForceRTX4090的性能比RTX3090Ti高60%,在GeekbenchCUDA基准测试中比RTX3090高75%......
在创新活动的第二天,英特尔放出了 Sapphire Rapids 至强可扩展芯片的首份基准测试数据...AMD 即将推出的 Zen 4 霄龙(EPYC)服务器处理器、提供了多达 96C / 192T 的选项,另有云优化的 128C / 256T 衍生 SKU...在当天晒出的这组基准测试图表中,英特尔侧重于展示 Sapphire Rapids 芯片上的各款加速器的表现,以及如何较更高核心数 AMD EPYC 竞品更智能地工作并降低能耗......
尽管 Ampere 的 Altra Max CPU 已经推出有段时间,但知名超频专家 Der8auer 还是决定拿一枚80核 ARM 处理器进行测试,以评估它在标准 PC 基准测试中的表现...最后,开盖表明 Ampere Altra Max Q8030CPU 采用了基于 TIM 的焊料、且芯片尺寸达到了573.75m㎡(22.5×25.5mm)......
PassMark 数据库刚刚迎来了首批 Apple M2 芯片的基准测试成绩,可知其表现有望于 x86 台式 CPU 一战...如图所示,Apple M2 的单线程性能得分为 4116,仅次于 i9-12900KS(4387)、i9-12900K(4212)和 i9-12900KF(4209)......