首页 > 传媒 > 关键词  > AI推理最新资讯  > 正文

国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍

2026-01-19 19:40 · 稿源: 站长之家用户

2026年1月15日,北京—— 继英伟达CEO黄仁勋在CES2026发布革命性“推理上下文内存存储平台”后,本土高性能存储厂商绿算技术(ForinnBase)今日宣布,其旗舰产品GP7000系列全闪存储平台已通过英伟达适配,成为全球首批、也是唯一支持G3级KV Cache分层存储的国产化解决方案,为下一代AI工厂建设提供了关键的基础设施支撑。

一、 背景:G3级存储——AI推理的“战略储备库”

黄仁勋在CES演讲中指出,随着大模型上下文窗口扩展至百万级Token,KV Cache容量呈爆炸式线性增长,仅靠GPU HBM和机架级缓存已无法满足大规模并发需求。

核心需求:G3级存储作为持久化溢出层,需通过NVMe-oF/RDMA网络为每个GPU提供16TB以上的扩展访问空间,同时保持<50μs的端到端延迟和200GB/s级带宽。

架构挑战:黄仁勋强调,“G3不是简单的数据落盘,而是需要与BlueField-4DPU和Spectrum-X网络原生集成,实现毫秒级缓存预热和智能卸载。这要求存储系统必须采用存算分离架构,将元数据操作与数据路径完全解耦。”

二、 方案:GP7000——为G3级量身定制的存算分离架构平台

绿算技术GP7000系列采用以太网闪存簇(EBOF)设计,单系统配备24个PCIe5.0NVMe U.2盘位,通过双主控板实现冗余。其核心指标精准匹配G3层需求:

极致性能:单机提供6480万IOPS、288GB/s带宽与20μs级延迟,性能较传统存储服务器提升17倍。

超高能效:整机功耗<900W,每GB/s带宽功耗仅3.1W,满足AI工厂的5倍能效目标。

深度集成:原生支持BlueField-3/4DPU与Spectrum-X交换机,通过NVMe-oF/RoCEv2/GDS协议实现GPU直连。

绿算技术产品总监孔维海透露:“GP7000采用DPU+ASIC+FPGA多元异构计算架构,将KV Cache的索引管理、数据压缩和网络协议栈完全硬件卸载,消除了CPU瓶颈。”其分布式KV Cache管理器可与英伟达Dynamo开源项目无缝衔接,实现跨机架的缓存一致性。

三、 验证:DGX GB300场景下的实测性能

在英伟达DGX GB300SuperPOD测试环境中,GP7000作为G3存储池展现出显著优势:

吞吐量:当KV Cache溢出至G3层时,仍能保持5倍tokens/s的生成速度,符合性能目标。

延迟:通过GPU Direct Storage(GDS)技术,首Token时间仅增加3-5ms,远低于传统方案的50ms+损耗。

扩展性:单台DGX GB300节点可配置2个GP7000机柜,提供28PB级缓存容量,支撑万级并发长对话请求。

四、 意义:国产化替代与“虚拟GPU”效应

业内专家认为此举是国产存储参与全球AI基础设施尖端竞赛的关键一步。

某智算中心CTO评价:“GP7000已通过金融、通信等关键行业认证,在混合负载下实现99.9999%可用性,故障率较存算一体架构降低75%。”

某国家实验室负责人指出:“在当前技术背景下,通过存储层优化,可在同等算力下提升30%以上的推理吞吐量,这相当于获得了‘虚拟GPU’。”

五、 生态:从硬件到软件的深度适配

绿算技术白皮书披露,GP7000已完成广泛生态适配:

硬件:英伟达DGX H100/H200/GB300、AMD Instinct MI300、沐曦曦云C系列等。

软件:英伟达Dynamo/vLLM/TensorRT-LLM、华为UCM、Kubernetes CSI等。

国产数据库:OceanBase、TiDB、GaussDB等。

在大模型推理场景中,GP7000可通过命名空间隔离与智能冷热分层技术,为每个推理实例分配独立的KV Cache分区,并将高频数据预加载至G2层,实现成本与效率的最优平衡。

六、 展望:2026年下半年规模化部署与未来演进

当前进展:GP7000已于2025年Q3量产,并获得了某头部云厂商数千节点订单。

未来规划:公司正在研发基于PCIe6.0的下一代GP8000,目标是将G3级带宽提升至1TB/s。

正如黄仁勋所言,“AI工厂的存储革命才刚刚开始。”当KV Cache从GPU的“包袱”转变为可弹性扩展的“战略资源”,像GP7000这样的专业存储正从配角演进为决定AI服务成本与体验的核心胜负手。

七、关于绿算技术

绿算技术有限公司(ForinnBase)成立于2021年,专注于DPU驱动的高性能存储系统研发。其GroundPool系列产品已服务金融、科研、智算中心等领域,是全球首批支持G3级KV Cache分层存储的唯一国产化解决方案。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 世界顶尖科学家协会发布OPENSCI项目:探索开放科学基础设施的未来路径

    世界顶尖科学家协会近日发布开放科学基础设施项目OPENSCI,旨在利用区块链与人工智能技术,构建一个去中心化的全球科研协作网络。该项目计划于2026年迪拜世界顶尖科学家峰会期间正式推出,致力于实现科学知识的长期保存、可信验证与跨学科合作。OPENSCI将支持科研成果、假说与数据集的记录与验证,形成透明、可追溯的知识基础,为全球科研提供可持续支撑。

  • 忆联UH812a以MLPerf Storage标杆级验证,重塑AI存储效能,奠定智能算力基石

    随着AI大模型进入万亿参数时代,传统存储性能测试已难以真实反映存储系统在实际训练场景中对成本与效率的核心影响。为此,全球权威AI基准测评组织MLCommons正式推出MLPerf Storage基准测试套件,为行业建立起一套贴合实际、具有指导意义的权威评估框架。区别于传统存储性能测试,MLPerf Storage基准的核心价值在于直接评估存储系统能否支撑GPU集群达到并维持高利用率——这直

  • 中国存储品牌江波龙,以mSSD夯实端侧AI存储技术底座

    中国存储品牌江波龙推出行业首款集成封装mSSD(Micro SSD),采用Wafer级系统级封装技术,将控制器、NAND Flash等元件集成于单一封装体内,体积仅20×30×2.0mm、重2.2g。该产品以高性能、高可靠、更灵活的特性重塑传统SSD形态,顺序读取速度达7400MB/s,4K随机读取达1000K IOPS,并具备宽温域运行与抗震动能力。mSSD已渗透至PC笔电、游戏掌机、无人机、VR设备及端侧AI等领域,成为连接存储硬件与多元应用场景的关键纽带,为终端设备轻量化、高性能与低功耗需求提供创新解决方案。

  • 对话AI NEWS平台Ancher:曾经信息流产品的胜利者,如今却决定颠覆它

    ​如果一定把“00后”作为AI浪潮的原著民,那么Ancher创始人Vincent Wu 显然不是最“典型”的AI创业者。 他是经历了从报纸到网站,再到移动客户端,美国三代媒体平台系统性变革的“老兵”。在长期以白人为绝对主导的美国新闻业态里里,顶着一张同样“非典型”的亚洲面孔,成为了极少数打入西方新闻业核心圈层的华人: 他担任过美国最大的本地资讯平台NewsBreak COO,更早之

  • 强强联合!京东x佰维存储战略携手,共拓消费存储新蓝海

    国内领先存储品牌佰维存储与京东签署深度战略合作协议。双方将围绕佰维全系消费级存储产品展开全面协作,从产品推广到营销创新深度融合,共同应对AI技术普及带来的市场变革,致力于为消费者提供可靠、高速的数据存储解决方案。此次合作标志着佰维在深化零售渠道布局、贴近终端用户方面迈出关键一步。

  • 基于麒麟信安操作系统:水电八局OA系统上线!打造国产化智慧办公实践典范

    中国水利水电第八工程局基于麒麟信安操作系统建设协同办公OA系统,实现数万员工跨区域、跨部门高效协作,成为电力建设集团旗下首批实现全栈国产化升级的标杆单位。该系统依托麒麟信安操作系统的安全稳定性和国产生态兼容性,显著提升办公效率,如公文签批时间从3天缩短至4小时,业务审批效率提升50%。同时,系统通过多项安全认证,有效保障数据安全,为能源基建行业树立了国产化智慧办公实践典范。

  • 硬科技突围:一颗中国芯片,如何破解AI算力的“存储墙”难题?

    在全球AI算力竞争白热化的今天,存储瓶颈正严重制约大模型的实际性能。绿算技术公司推出了一款基于自主IP的NVMe-oF桥接芯片原型“擎翼”,旨在将GPU显存中容量巨大的KV Cache卸载到由标准NVMe SSD构建的存储池中,并保证访问延迟低于20微秒。该芯片通过全硬件卸载和零拷贝传输,实现了高达489万IOPS和21.8GB/s的顺序读取带宽,功耗低于10瓦。这不仅大幅降低了扩展KV Cache至TB级的成本,也为AI大模型的规模化部署提供了关键的经济性保障。此次尝试标志着AI算力竞争正从单一的“算力芯片竞赛”演进到“系统级效率竞赛”。

  • 存储大涨价!1TB REDMI Turbo 5 Max只卖3399元 卢伟冰:行业罕见

    小米集团总裁卢伟冰宣布,REDMI Turbo 5 Max 16GB 1TB版本正式上架,定价是3399元。 卢伟冰表示,大家呼声很高的1TB版本Turbo 5 Max来了,首销3399元,行业罕见的1TB真香价,下周一开始发货,感谢大家支持。 他还表示,虽然内存涨价,但Turbo 5系列依然给出10亿内存补贴,REDMI致力于打造更具性价比的满配性能旗舰,持续引领中端性能突破与体验变革,这是我们的初心,也是我们的坚�

  • 2026国企招采平台测评榜出炉 谁才是国产化标杆

    目前,国有企业电子招标平台越来越向复合型功能发展——既要应对因出资机构不同而出现的多样合规政策,又要提升招标质量、保障项目交付,更要在成本控制与风险防控中找到平衡点,而这一切的核心都离不开“全流程贯通”与 “生态高适配”的双重能力。用友、浪潮、欧菲斯、新点、三维天地等国有企业电子招标采购平台供应商是市场上的主流选择,各家在不同领域均�

  • DDR4“断供警报”解除在即?存储大厂重置产能策略

    过去一年DDR4内存价格飙升近1800%,出现旧款比新款贵的罕见倒挂现象。这轮“疯牛行情”源于AI算力爆发带来的内存需求激增,以及国际大厂战略重心转向高毛利产品,主动削减DDR4产能。同时,市场投机情绪加剧短期紧缺,推高价格。国产供应链方面,长鑫存储计划推出新一代DDR4产品以缓解国内供应短缺,有望为市场带来缓冲。

今日大家都在搜的词: