首页 > 传媒 > 关键词  > MLPerf最新资讯  > 正文

3节点集群带宽突破 513GBps 焱融存储再度登顶MLPerf Storage 全球榜单

2025-08-05 17:16 · 稿源: 站长之家用户

       2025年8月4日,全球权威的 AI 性能基准评测组织 MLCommons® 正式发布最新一轮 MLPerf® Storage v2.0基准测试结果。来自中国的存储厂商焱融科技在此次测试中表现突出,其全闪存储一体机 F9000X 不仅在全部模型测试中性能领先,更以三节点存储集群513GB/s 的总带宽刷新3D-Unet 模型测试的纪录,登顶 MLPerf 全球性能榜单。

       MLPerf Storage:AI 存储性能的黄金衡量标准

       MLCommons 作为全球人工智能工程联盟,始终致力于规范 AI 技术的准确性、安全性、速度与效率评估,推动 AI 系统性能优化,其权威性得到全球业界广泛认可。而 MLPerf Storage Benchmark 作为该联盟专为 AI 场景打造的存储基准测试,通过模拟真实 AI 训练中的 I/O 操作,精准衡量存储系统向 GPU 输送训练数据的速度与能力。

       此次发布的 MLPerf Storage v2.0,在 v1.0基础上进一步升级:除保留3D-Unet、ResNet50、CosmoFlow 三大训练模型外,新增 Checkpoint 工作负载,更全面覆盖训练中断点恢复、模型存档等实际场景。为确保结果的严谨性与公正性,v2.0要求每项基准测试必须多次重复执行(训练任务5次、Checkpoint 任务10次),且全程连续运行无失败,同步提交完整测试日志,最终结果取多次运行的平均值 —— 这一系列严格规范,使其成为业界衡量 AI 存储性能时最具参考价值的权威标准。

       焱融全闪刷新全球纪录 最小规模集群性能第一

       MLPerf Storage 基准测试既支持单个计算节点(客户端)运行多个 ACC(GPU 加速器)的模型测试,也适配分布式训练集群场景 —— 通过多客户端模拟真实数据并行访问存储集群,充分覆盖从单节点到分布式集群的全场景 AI 工作负载。其最关键的衡量标准,是在保证高性能 GPU 利用率(3D-Unet 与 ResNet50模型下为90%,CosmoFlow 模型下为70%)的前提下,存储系统所能实现的聚合带宽。这项指标是衡量存储系统实际能力的核心,直接体现其在 AI 训练过程中是否能够充分“喂饱”计算资源,避免造成 GPU 空闲浪费。

       最新测试结果显示,在3D-Unet、ResNet50以及 CosmoFlow 所有模型的测试场景下,于通用硬件环境中,针对分布式存储的最小规模集群,即三节点存储集群,焱融全闪 F9000X 在全球知名分布式存储厂商中脱颖而出,集群总带宽等关键指标位列全球第一。尤其是在3D-Unet 模型测试中,集群带宽达到513GB/s ,为迄今已公布结果中的最高值。

数据来源:MLCommns 官方

       除分布式场景外,在单客户端测试中,焱融全闪 F9000X 同样展现出优异性能,进一步验证了其在不同部署规模下的强劲数据处理能力。

       此外,在新增的 Checkpoint 工作负载测试中,针对 Llama3-70B 模型场景,通过部署8个客户端模拟并发请求、搭配64个模拟 GPU 环境,实现221GB/s 读取带宽与79GB/s 写入带宽的高性能表现。这种稳定且高效的带宽支撑能力,能够精准保障 Checkpoint 文件在模型训练全流程中实现秒级极速读写,从底层存储层面为 AI 训练任务的断点续训连续性与模型训练稳定性筑牢技术根基,助力企业从容应对大规模模型训练的严苛存储需求。

       焱融存储 MLPerf 测试表现背后:技术积淀与生态协同是关键

       据了解,焱融存储去年便参与了 MLPerf Storage v1.0基准测试,并以出色成绩从全球知名存储厂商中强势突围。焱融存储之所以能在 MLPerf 存储基准测试中持续取得优异成绩,核心在于其长期深耕 AI 大模型训练与推理等核心场景的技术积累:一方面,通过长期深耕大模型训练与推理等核心场景,深度理解 AI 工作负载特性;另一方面,从架构设计到软硬件全技术栈,持续推进系统性创新与优化,构建起应对高性能负载的核心能力。

       与此同时,焱融也与 NVIDIA、Intel、新华三(H3C)、忆恒创源(Memblaze)、大普微(DapuStor)等上下游生态伙伴展开深度协同,在网络、芯片、服务器、SSD 等关键环节紧密合作,实现软硬件的深度适配与极致优化,有效保障系统在 AI 基础设施全链路中的高效稳定运行。

       公开资料显示,焱融全闪存储基于其自研的高性能分布式文件系统 YRCloudFile,通过多项关键技术实现性能突破:

       采用自研 Multi-Channel 网络带宽聚合技术,可整合多张 InfiniBand/RoCE 网卡性能,在大 IO 场景下充分释放硬件潜力,支撑超高速数据传输;

系统具备负载感知能力,可根据压力智能切换中断与轮询模式,有效提升 IOPS 性能;

在 IO 模型层面,通过异步非阻塞设计减少上下文切换、增强并行处理能力,并通过处理器核心资源的高效分配,降低线程调度开销,支撑高并发数据处理的同时,充分发挥 NVMe SSD 的性能优势;

针对大规模 GPU 集群易出现的网络拥塞问题,专项优化传输机制,保障数据传输的高效与稳定。

       随着大模型向千亿、万亿参数演进,存储作为底层支撑的性能要求持续提升。此次焱融科技在 MLPerf Storage v2.0中的表现,不仅印证了中国存储厂商的技术实力,也为 AI 基础设施的性能优化提供了可参考的实践路径。业内预计,未来存储系统的高带宽、低延迟能力依然是 AI 大模型广泛落地的关键竞争力之一。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 900P大考见真章:天玑9500 GPU强度封神

    9月手机市场迎来A19 Pro、天玑9500、骁龙8 Gen 5三款旗舰芯片。今年最大变化是零售机数据提前公开,参考价值直线上升。游戏负载持续加重,《星穹铁道》分辨率已冲至900P+,对手机GPU架构与能效提出更高要求。天玑9500在GPU能效表现亮眼,极客湾测试中一骑绝尘,3DMark实测性能与能效曲线均压制当代旗舰。联发科GPU硬实力已成“基操”,稳定高画质与低功耗兼顾。建议购机前优先查看零售机实测数据,期待更多实测帮助用户稳妥选择。选机看真功夫,把游戏稳帧交给天玑9500。

  • GMIF2025:慧荣科技展示从云端到边缘的AI存储主控技术

    9月25日,第四届GMIF2025创新峰会在深圳湾万丽酒店召开,聚焦“AI应用,创新赋能”主题。慧荣科技总经理苟嘉章发表演讲,指出AI推动存储架构从“分层存储”向“存算融合”演进,存储成为AI计算关键环节。峰会展示了慧荣在数据中心、边缘与AI PC、车载嵌入式等领域的最新存储解决方案,并呼吁产业链协同创新,应对2026年可能出现的存储芯片紧缺局面。慧荣凭借主控芯片技术优势荣获“杰出主控技术创新奖”。

  • Testin 云测入选 “2025 新科技 100 强金 i 奖”,AI测试技术成核心壁垒

    9月19日,Testin云测凭借AI测试技术入选“2025新科技100强金i奖”,获评“AI测试领航服务商”。其推出的Testin XAgent系统通过自然语言处理、视觉识别与自主探索能力,实现测试用例自动生成与全流程覆盖,推动软件测试从自动化向智能化升级。同时,Testin积极参与行业标准制定,联合信通院启动智能测试能力评估体系,助力构建规范化行业生态。目前,Testin已服务超300万款应用,未来将持续以AI为核心引擎,重塑软件研发质量效能,彰显中国技术在AI测试领域的领先实力。

  • OPPO A6开售:售价1599元起 搭载7000mAh六年长寿电池

    OPPO A6于9月30日开售,起售价1599元。主打耐用性能,配备6.57英寸AMOLED柔性直屏,支持120Hz刷新率。搭载天玑6300处理器,承诺六年使用不卡顿。内置7000mAh大电池,支持80W超级闪充,续航强劲。机身轻薄,防护出色,通过IP69认证。后置双摄满足多样化拍摄需求,提供三种存储版本,最高售价2099元,兼顾性价比与大容量选择。

  • 挑战做100个“猫”房子,90后小鲁班如何获赞2000万?

    ​当代鲁班下凡,只为一只猫! “楚喵的世界”上线即封神!@爱鼓捣的邢志磊 成为抖音精选新的爆款制造机。其中,《猫咪的地铁站》一条视频就能达到975万点赞、44万评论,直接把“人不如猫”卷成2025最离谱共识。 当牛马打工人还在给猫主子们买9块9包邮的纸箱,这位山东爸爸已经手搓地铁、别墅、电影院,直接把喵星人送进喵生巅峰! 在短视频爆火的快时代,他的慢内容�

  • 苹果A19单核性能登顶全球第一!超越一众PC CPU:功耗仅4W

    苹果A19芯片在PassMark单核性能测试中表现卓越,以5149分登顶榜首,超越英特尔Core Ultra 9 285K和AMD EPYC等桌面处理器。其仅依靠被动散热,功耗约4瓦,能效优势显著。尽管多线程性能受限于核心数量,但作为移动设备芯片,这一成绩已足够亮眼。

  • 碾压级GPU性能,3倍光追提升,天玑9500打造手机游戏最强心脏

    2025年9月22日,联发科发布天玑9500旗舰5G芯片,其GPU性能与能效双领先,被媒体称为“最强GPU”。天玑9500搭载G1-Ultra核心,采用全新GPU+Dynamic Cache架构,在3DMark测试中峰值达3402分,功耗仅12.3W,全程超越A19Pro。光追性能提升3倍,支持主机级虚幻引擎5.5 Nanite技术,实现千万级模型渲染,并首发Megalights技术,流畅运行《暗区突围》光追120FPS。实测显示其图形表现达到移动处理器顶尖水平,重构移动端图形性能天花板。

  • 鸿蒙智行享界S9T上市13天大定破 15000 台

    鸿蒙智行首款旅行车享界S9T于9月16日上市,起售价30.98万元。新车上市首周大定订单突破1.3万台,第13天突破1.5万台,市场热度持续攀升。智能配置方面搭载ADS4高阶智驾系统、华为途灵平台及鸿蒙ALPS健康座舱,提供卓越视听体验。提供纯电与增程两种动力版本,纯电版零百加速最快3.95秒,续航最高801公里;增程版综合续航达1305公里。车身尺寸达5160/2005mm,轴距3050mm,后备箱容积660L可扩展至1677L,空间表现突出。

  • 真我GT8 Pro入网:挑战5000元以内最强Pro旗舰

    真我GT8+ Pro已获入网许可,支持120W有线闪充,电池容量超7000mAh并兼容无线充电。核心配置包括第五代骁龙8至尊版、2亿潜望长焦、2K直屏、电竞双芯及大师级对称双扬声器。其2亿潜望长焦为realme独家技术,提供全维度影像自由,支持120倍变焦,10倍以上细节清晰,实现构图自由。该机主打质价比,挑战5000元内最强Pro旗舰,将于10月发布。

  • 1699元 小米路由器BE10000 Pro发布:三频万兆无线 可装SSD当网盘

    小米9月25日推出旗舰路由器BE10000+Pro,售价1699元。产品以AI双万兆和Wi-Fi 7为核心卖点,性能、扩展性与智能化实现多重突破。无线端支持三频万兆速率,最高达10024Mbps,配备12根天线与12路信号放大器,轻松应对大流量或多设备并发。有线端配备双万兆网口与4个2500Mbps高速网口,提升大数据连接效率。经过187类严苛测试,稳定性强,消除断网顾虑。支持加装M.2硬盘与USB接口,可打造个人轻存储网盘。搭载AI场景加速功能,针对游戏、影音等五大场景一键优化,并支持中继与蓝牙网关,可连接300+蓝牙设备,联动响应速度提升3倍。

今日大家都在搜的词: