首页 > 传媒 > 关键词  > GTC大会最新资讯  > 正文

华瑞指数云ExponTech联合合作伙伴在硅谷发布新型AI存储方案

2025-04-01 13:36 · 稿源: 站长之家用户

全球AI的优质盛会GTC于 3 月 17 日到 3 月 21 日在美国硅谷盛大举行。在GTC大会期间,华瑞指数云ExponTech CTO曹羽中受邀参加了专注于AI Storage的技术研讨会并发表演讲。在演讲中,曹羽中介绍了ExponTech与合作伙伴ScaleFlux, AIC基于英伟达的BlueField3 DPU以及英伟达比较新发布的Spectrum-X网络打造的新型AI Storage方案,展示了该方案的实际测试数据,并与合作伙伴,AI Storage行业专家以及一些大型客户进行了深入讨论。与会的专家均表示该方案的实测性能数据以及综合优势表现远超预期,具备很高的商业价值,very impressive!

新型AI存储方案采用的软硬件方案:

硬件:

F2026 AI服务器,是一台2U闪存JBOF,配备 2 个或 4 个NVIDIA BlueField- 3 数据处理单元(DPU)和 24 块高性能ScaleFlux CSD5000 NVMe SSD(CSD5000 是ScaleFlux公司比较新推出的一款内置硬件压缩与解压缩能力的高性能NVMe SSD介质);

NVIDIA Spectrum-X网络交换机;

软件:

华瑞指数云ExponTech下一代分布式存储软件平台WADP (WiDE AI Data Platform);

(本方案采用的2U存储节点及ScaleFlux CSD5000 NVMe SSD)

基于此方案的AI训练和推理环境的实测部署架构如下图:

1 台2U AIC JBOF作为存储服务器, 配备 4 块NVIDIA BlueField3 DPU, 提供1600Gbps网络带宽, 24 块ScaleFlux CSD5000 NVMe SSD,ExponTech WADP存储软件的后端运行于BlueField3 DPU内;

1 台标准2U服务器作为计算服务器,配备 4 块NVIDIA BlueField3 DPU,提供800Gbps网络带宽,在DPU内部运行ExponTech WADP存储软件的存储网关和协议;

计算服务器上可以配置GPU,用于训练或推理,存储软件和网络流量运行于DPU内,存储IO不会消耗计算服务器的CPU和内存资源,计算服务器可以拥有更充沛的资源用于计算处理;

测试环境特别选择了 4 台NVIDIA Spectrum-X交换机组成两层网络,主要是为了模拟与验证在大规模组网的情况下,RoCE网络是否依然可以很好的处理拥塞,存储软件可以依然保持稳定的存储性能和低时延;

存储服务器(JBOF)和计算服务器均可以按需独立扩展,按需加入更多的存储服务器(JBOF)或者计算服务器,构成大规模的,存算分离的,按需扩展的AI训练和推理集群。

基础存储性能验证:

基于上一节所述的实测部署环境,进行了存储系统的基础性能验证,其验证方法是从计算节点上运行FIO,测试存储系统的基础性能指标。

单个计算节点可以达到近90GB/s的存储带宽,接近计算节点网卡的物理带宽上限;

单个计算节点可以达到 310 万IOPS,当配置更多的计算节点时,可以同步获得更多的IOPS。考虑到整个存储系统的后端以及协议端都是跑在DPU内,DPU内的CPU处理性能远远不如服务器配置的CPU,单个计算节点+单个存储节点即达到 310 万IOPS已经充分展现了本方案相当惊人的IO处理效率;

存储系统的IOPS与存储节点上部署的数据处理单元(DPU)数量呈线性比例扩展,系统的IOPS随DPU部署数量线性扩展,表明其具备较好的横向扩展能力。本方案采用的存储节点最多可以配置 8 张DPU(当前测试环境配置 4 张),还可以实现IOPS性能翻倍以及网络带宽翻倍;

存储系统在使用小IO size时,并发大压力时延低至266us, 在使用大IO size时,打满计算节点的网络物理带宽,时延还能始终保持在 1 毫秒以下。

MLPerf Storage v1. 0 测试结果:

MLPerf™ 是影响力最广的国际AI性能基准评测,MLPerf™ Storage是针对AI Storage的基准性能测试,可以较为全面的评估测试AI应用程序的存储需求。MLPerf™ Storage基准测试通过运行一个分布式训练测试程序,模拟GPU计算过程,在此过程中真实的执行AI服务器对存储系统的读写访问,以此来测试存储系统能够支撑的比较大GPU数量和带宽表现。

MLPerf Storage v1. 0 于 2024 年 8 月推出,国内外一共有十三家从事高性能存储研发的厂家参与了测试并提交正式测试结果,其中包括DDN(Lustre),华为,WekaIO,Hammerspace等知名的分布式文件系统厂家。

本次我们选择了ResNet50 模型(主要用于图像分类和图像识别场景),在上述 1 存储节点(JBOF)+ 1 计算节点的测试环境上进行了MLPerf Storage v1. 0 基准测试,测试的结果如下:

测试结果表明:

ExponTech的新型AI存储方案具备全球领先的性能,单客户端能够支持的GPU卡的数量超过了所有参与了MLPerf Storage v1. 0 正式测试的厂商,位居全球首先;单客户端能够实现的存储带宽达到近30GB/s, 位居全球第二;本次测试环境只有一个客户端节点(计算节点),CPU和内存配置较低,在运行MLPerf Storage v1. 0 的测试中已经达到了客户端节点的计算能力的瓶颈,但是还远远没有达到存储节点的存储能力的瓶颈。如果换用处理能力更强的计算节点来做测试,可以测试出更高的性能数据,即支持更多的GPU卡,实现更高的存储带宽。

总结

基于本次在真实的环境上的全面测试,总结一下ExponTech与合作伙伴ScaleFlux, AIC基于英伟达的BlueField3 DPU以及英伟达比较新发布的Spectrum-X网络打造的新型AI Storage方案的关键特点和优势:

  1. 世界优质性能,SPC-1 评测超越所有高端全闪存储阵列,打破世界纪录,MLPerf Storage v1. 0 测试数据大幅度超越WekaIO, DDN等知名并行文件系统;

  2. 世界优质容量密度,当前每2U Storage Node可实现超过1.6PB存储裸容量,明年可扩展至每2U超过6.6PB,比较大化数据中心空间的AI数据价值;

  3. 配置的ScaleFlux CSD5000 NVMe SSD具有盘内透明压缩解压缩能力,能够在不消耗额外系统资源,不影响性能的情况下实现存储裸容量的数倍放大,存储容量效率获得惊人的提升;

  4. 同一平台上同时支持高性能分布式块存储和文件存储等多种协议,除了支持AI的训练和推理场景,还可以覆盖数据汇集,数据准备,RAG等AI Pipeline全场景,无须为AI Pipeline配置不同的存储方案以及反复进行数据拷贝移动,可以实现AI算力和存力的完全存算分离和独立扩展,具备更好的可管理性和效率;

  5. 强大的并行扩展性,存储节点及计算节点均可以独立的水平扩展,同时实现存储性能和容量的等比例扩展;

  6. 可靠性高,可维护性高,存储节点采用相比标准服务器更为精简的JBOF,硬件故障率更低,同时JBOF内部采用冗余的硬件设计来保障可靠性,提升可维护性;

  7. 支持基于RoCE的超大规模组网,采用RoCE动态路由和细粒度的负载均衡实现更好的拥塞控制,基于标准以太网在大规模RDMA组网中实现有效带宽, 低抖动和超低时延;

  8. 优化的总体拥有成本(TCO),高密度的存储节点+透明盘内压缩+新型软件定义存储软件的组合简化了硬件成本,大幅度提升了存储空间利用效率和读写性能,简化了管理,AI客户将因此大幅度优化其AI Storage的总体拥有成本(TCO);

  9. 基于此方案的KV Cache大规模持久化方案也即将推出,实现AI推理集群内的K,V向量的全局共享,能够以低成本高性能的大规模存储能力替代AI推理过程中K,V向量的大量重复运算,实现AI推理算力成本的大幅降低。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • 没有Pro Max!一加Ace 6T命名敲定:首发骁龙8 Gen5

    此前有网友在机场拍到一加Ace 6 Pro Max包装盒,不少网友认为这就是一加即将推出的骁龙8 Gen5新机。 博主数码闲聊站表示,一加骁龙8 Gen5新机不叫Ace 6 Pro Max,而是命名为Ace 6T,这里的T不是Turbo,是一加纯正的性能基因,一加的Turbo系列也已在路上了。 对比一加Ace 6,一加Ace 6T处理器由骁龙8 Elite换成了骁龙8 Gen5,电池容量突破8000mAh,还将带来炫酷的联名。 该博主还爆料,高通

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • 英伟达总市值突破5万亿美元

    10月30日,英伟达股价上涨3.2%,市值突破5万亿美元,成为全球首家达此里程碑的公司。创始人黄仁勋个人财富随之突破1800亿美元,跻身全球富豪榜第八位。今年以来,英伟达股价累计上涨54%,市值从4万亿增至5万亿仅用113天。公司透露,Blackwell及新一代Rubin芯片正推动销售增长。美国银行将目标价上调至275美元,预示股价或再涨30%,市场对其前景持续乐观。

  • “itc智能云会议系统”通过科技创新与品牌建设成果评价,关键技术达国内领先水平!

    ITC保伦股份联合多家顶尖机构研发的“智能高效云会务管理系统”通过专家评审鉴定。该系统以云会务为基础,融合无纸化会议、远程视频会议等功能,打造全方位沉浸式智慧会议新生态。项目在云会议系统关键技术取得突破,达国内领先水平,已获29项国家发明专利、22项软件著作权,形成系列产品并实现规模化应用。专家认为该成果将推动政企、金融、医疗等行业数字化转型,提供更智能便捷的会议体验。

今日大家都在搜的词: