搭载英伟达GPU，全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

2024-03-30 17:57 · 稿源：站长之家用户

在美国硅谷圣何塞召开的 NVIDIA GTC 大会上，全球领先的向量数据库公司 Zilliz 发布了 Milvus2.4版本。这是一款革命性的向量数据库系统，在业界排名靠前，它初次采用了英伟达 GPU 的有效并行处理能力和 RAPIDS cuVS 库中新推出的 CAGRA（ CUDA-Accelerated Graph Index for Vector Retrieval ）技术，提供基于GPU的向量索引和搜索加速能力，性能可提升50倍。

Milvus2.4的 GPU 加速性能提升效果令人惊叹。基准测试显示，与目前市面上先进的基于 CPU 处理器的索引技术相比，新版 GPU 加速 Milvus 能提供高达50倍的向量搜索性能提升。目前，Milvus2.4的开源版本已经对外发布。

对于希望使用全托管云数据库服务的企业用户来说，还有一个好消息，那就是 Zilliz 提供的 Milvus 商业版全托管云服务 Zilliz Cloud 计划将在今年晚些时候升级推出 GPU 加速功能。

▲Zilliz Cloud

截至当前，Zilliz Cloud 已经实现包括阿里云、腾讯云、AWS、谷歌云和微软云在内的全球5大云13个节点的全覆盖，除了分布在杭州、北京、深圳的5个国内服务区，其他8个节点分布在海外，包括美国的弗吉尼亚州、俄勒冈州、德国的法兰克福、新加坡等城市和地区。Zilliz 已成为头家同时提供海内外多云服务的向量数据库企业。

Milvus 是什么?

Milvus 是一款为大规模向量相似度搜索和 AI 应用开发设计的开源向量数据库系统。它最初由 Zilliz 公司发起开发，并在2019年开源。2020年，该项目加入 Linux 基金会并成功毕业。

自推出以来，Milvus 在 AI 开发者社区中大受欢迎并被广泛采用。在GitHub上，Milvus 拥有超过26，000个星标和260多位贡献者，全球下载和安装量超过2000万次，已经成为全球使用最广泛的向量数据库之一。Milvus 已经被5，000多家企业所采用，服务于AIGC、电子商务、媒体、金融、电信和医疗等多个行业。

▲部分 Milvus 企业用户列表来源:Milvus官网

为什么需要 GPU 加速?

在数据驱动的时代背景下，快速准确地检索大量非结构化数据对于支持前沿AI应用至关重要。无论是生成式AI、相似性搜索，还是推荐引擎、虚拟药物发现，向量数据库都已成为这些高档应用的核心技术。然而，对于实时索引和高吞吐量的需求不断挑战着基于CPU的传统解决方案。

实时索引

向量数据库通常需要持续且高速地摄取和索引新的向量数据。实时索引的能力对于保持数据库与比较新数据的同步至关重要，避免产生瓶颈或积压。

高吞吐量

许多使用向量数据库的应用程序，例如推荐系统、语义搜索引擎和异常检测等，都需要实时或近实时的查询处理。高吞吐量确保向量数据库能够同时处理大量涌入的查询，为最终用户提供高性能的服务。

向量数据库的核心运算包括相似度计算和矩阵运算，这些运算具有并行性高和计算密集等特点。GPU 凭借其成千上万的运算核心和强大的并行处理能力，成为了加速这些运算的理想选择。

Milvus2.4 技术架构

为了应对这些挑战，英伟达开发了CAGRA。这是一个利用GPU的高性能能力为向量数据库工作负载提供高吞吐量的GPU加速框架。接下来，我们来看看 CAGRA 是如何与 Milvus 系统整合的。

Milvus 专为云原生环境设计，采用模块化设计理念，将系统分为多个组件，分别处理客户端请求、数据处理以及向量数据的存储和检索。得益于这种模块化设计，Milvus 可以轻松地更新或升级特定模块，而无需改变模块间的接口，使得在 Milvus 中集成 GPU 加速变得简单可行。

▲Milvus2.4架构图

Milvus2.4的架构包括协调器、访问层、消息队列、工作节点和存储层等组件。工作节点进一步细分为数据节点、查询节点和索引节点。其中，索引节点负责构建索引，查询节点负责执行查询。

为了充分利用GPU的加速能力，CAGRA 被集成到了 Milvus 的索引节点和查询节点中。这种集成使得计算密集型任务，如索引构建和查询处理，能够被转移到 GPU 上执行，从而利用其并行处理能力。

在 Milvus 的索引节点中，CAGRA 被集成到了索引构建算法中，利用 GPU 硬件来有效地构建和管理高维向量索引，显著减少了索引大规模向量数据集所需的时间和资源。

同样，在 Milvus 的查询节点中，CAGRA 被用于加速执行复杂的向量相似度查询。借助GPU的处理能力，Milvus 能够以比较罕见的速度执行高维距离计算和相似性搜索，从而加快查询响应时间并提升整体吞吐量。

性能评测结果

在性能评估过程中，我们使用了 AWS 上的三种公开实例类型:

m6id.2xlarge:搭载Intel Xeon8375C 处理器的 CPU 实例

g4dn.2xlarge:配备NVIDIA T4处理的GPU加速实例

g5.2xlarge:配备NVIDIA A10G 处理器的GPU加速实例

我们通过这些不同的实例类型来评估 Milvus2.4在不同硬件配置下的性能和效率，其中m6id.2xlarge 作为基于 CPU 处理器的性能基准，而 g4dn.2xlarge 和 g5.2xlarge 则用来评估GPU 加速的优势。

▲基于 AWS 的评测环境

在评测中，我们选用了 VectorDBBench（[4]）的两个公开向量数据集，评估 Milvus 在不同数据量和向量维度下的性能和可扩展性:

OpenAI-500K-1536-dim:包含50万个1，536维的向量，由 OpenAI 语言模型生成

Cohere-1M-768-dim:包含100万个768维的向量，由Cohere语言模型生成

索引构建时间

在索引构建时间的评测中，我们发现对于 Cohere-1M-768-dim 数据集，使用 CPU（ HNSW ）的索引构建时间为454秒，而使用 T4GPU( CAGRA )仅为66秒，A10G GPU( CAGRA )更是缩短到了42秒。对于 OpenAI-500K-1536-dim 数据集，CPU( HNSW )的索引构建时间为359秒，T4GPU( CAGRA )为45秒，A10G GPU(CAGRA)则为22秒。

▲评测索引构建时间

这些结果清楚地表明，GPU 加速框架 CAGRA 在索引构建方面明显优于基于 CPU 的 HNSW，其中 A10G GPU 在两个数据集上都是最快的。与 CPU 实现相比，CAGRA 提供的 GPU 加速将索引构建时间缩短了一个数量级，展示了利用 GPU 并行性进行计算密集型向量运算的优势。

吞吐量

在吞吐量方面，我们比较了集成 CAGRA GPU 加速的 Milvus 与使用 CPU 上 HNSW 索引的标准 Milvus 实现。评估指标是每秒查询数（ QPS ），用于衡量查询执行的吞吐量。在向量数据库的不同应用场景中，查询的批量大小( 单条查询处理的查询数量 )往往不同。在测试过程中，我们采用了1、10和100这三种不同的批量大小，获取真实而全面的评测结果数据。

▲评测吞吐量

从评估结果来看，对于批量大小为1的情况，T4GPU 比 CPU 快6.4到6.7倍，A10G GPU 则快8.3到9倍。当批量大小增加到10时，性能提升更加显著:T4GPU 快16.8到18.7倍，A10G GPU 快25.8到29.9倍。当批量大小为100时，性能提升持续增长:T4GPU 快21.9到23.3倍，A10G GPU 快48.9到49.2倍。

这些结果表明，利用 GPU 加速向量数据库查询可以获得巨大的性能提升，尤其是对于更大的批量大小和更高维度的数据。集成 CAGRA 的 Milvus 释放了 GPU 的并行处理能力，实现了显著的吞吐量改进，非常适合要求较好的性能的关键场景下的向量数据库工作负载。

开启新纪元

将英伟达 CAGRA GPU 加速框架集成到 Milvus2.4中，标志着向量数据库领域的一项重大突破。通过利用 GPU 的大规模并行计算能力，Milvus 在向量索引和搜索操作方面实现了比较罕见的性能水平，开启了实时、高吞吐量向量数据处理的新时代。

5年前， Zilliz 的工程师们在上海漕河泾的厂房里敲下了向量数据库历史上的全球首先行代码，开启了研发面向非结构化数据管理的新一代数据库的探险。

今天，Zilliz 和英伟达合作推出 Milvus2.4，展现了开放创新和社区驱动发展的力量，为向量数据库带来了 GPU 加速的新纪元。这一里程碑事件预示着又一个技术变革的来临，向量数据库有望经历类似于英伟达在过去8年中将 GPU 算力提高1000倍的指数级性能飞跃。

在未来十年，我们将见证向量数据库性能的1000倍飞跃。这将引发一场数据处理方式的范式转变，重新定义我们处理和利用非结构化数据的能力。

Zilliz 比较新动态

除了发布业界超前的 Milvus2.4，Zilliz 近期还有不少新动作:

Zilliz 正式开启 AI 初创计划!Zilliz AI 初创计划是面向 AI 初创企业推出的一项扶持计划，预计提供总计1000万元的 Zilliz Cloud 抵扣金，致力于帮助 AI 开发者构建有效的非结构化数据管理系统，助力打造高质量 AI 服务与运用，加速产业落地。Zilliz 将为全球的 AI 初创团队提供资源、技术、市场推广、销售等全方位的支持，符合要求的团队可获得全力资源与支持。欢迎各位开发者登陆 Zilliz 中文官网首页了解 Zilliz AI 初创计划，与 Zilliz 一起共建 AI 生态!

Zilliz Cloud 正式登录腾讯云，覆盖北京、上海两区，进一步为海内外用户提供更丰富的多云支持的向量数据库服务。截至目前，Zilliz Cloud 已实现全球5大云13个节点的全覆盖，除了在中国的杭州、北京、深圳五大服务区，其他8个节点分布在海外，包括美国的弗吉尼亚州、俄勒冈州、德国的法兰克福、新加坡等城市和地区。至此，Zilliz 已成为全球头个提供海内外多云服务的向量数据库企业。

Zilliz 发布「Milvus 北极星计划」，旨在汇集和团结 Milvus 社区的热心用户及开发者，组成社区大使团队。根据不同角色擅长的能力（Coding、写作、沟通、布道、活动组织等），在社区中分配职责，共同建设运营 Milvus 社区，为社区发展壮大探索方向、添砖加瓦。最终将 Milvus 社区打造为一个充满活力、创新开放、团结互助的全球化社区。关注 Zilliz 微信公众号，回复“北极星”可了解详情。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

突破数据库备份恢复瓶颈：华瑞指数云“无损快照”技术赋能企业数据库实现秒级数据保护

文章探讨了数字化时代下数据库备份与恢复技术的重要性，重点分析了传统备份方式的痛点（耗时、占用资源、性能影响）和快照技术的优势（秒级创建、空间节省、低I/O影响）。详细对比了COW（写时复制）和ROW（写时重定向）两种快照技术原理及优劣，指出ROW在写入性能上的优势。同时介绍了华瑞指数云WDS基于"无损ROW快照克隆"的创新方案，通过优化读写流程实现秒级备份恢复且性能零损耗。文章还对比了AWS RDS/Aurora和阿里云RDS/PolarDB等主流云数据库的备份实现方式，并通过PostgreSQL实践案例展示了WDS方案的高效性。最后强调分布式存储架构为数据库带来的性能突破和扩展能力，重新定义了企业级数据保护的标准。

数据保护数据库备份云存储
悦数图数据库一体机发布，让复杂关联计算开箱即用

文章介绍了悦数图数据库一体机在金融风控、政务治理等关键领域的应用价值。该产品采用软硬协同的垂直设计模式，深度整合图数据库引擎与底层异构算力，实现"开箱即用"的工程级交付。内置鲲鹏CPU、麒麟操作系统与悦数图数据库v5.0，已完成全栈信创生态适配，确保自主可控。性能提升5倍，单机支持100亿规模图数据存储，查询吞吐量较传统方案提升超500%。产品提�

金融风控政务治理能源监测
技术选型别盲目：为什么很多企业用错了分布式数据库？

本文探讨了分布式数据库的适用场景与选择误区。文章指出，分布式数据库并非万能解决方案，其最大优势在于横向扩展能力，适合互联网业务的海量用户、高并发等场景。但在传统企业级应用中，集中式数据库可能更优。文中列举了三种常见的"伪分布式"需求场景：分布式应用、多租户需求和跟风采购，强调技术选择应回归业务本质。最后以金仓数据库为例，介绍了�

分布式数据库数据查询应用性能
英伟达重夺全球市值第一头衔再度超越微软

去年6月19日，英伟达股价曾以135.58美元创下历史新高，当时总市值达3.335万亿美元，一举超越微软和苹果，首次登上全球市值最高上市公司的宝座。此后，在全球市值排名中，英伟达与苹果、微软展开激烈角逐，三者轮番登顶。上一次英伟达成为市值最高的公司是在今年1月24日。从英伟达自身的财务表现来看，其业绩也相当亮眼。根据英伟达2026财年第一季度财报，该季度公司

美股英伟达市值最高
国产时序数据库 IoTDB 全程护航朱雀二号改进型火箭试验、发射及北邮双星数据管理

2025年5月17日，蓝箭航天自主研发的朱雀二号改进型遥二运载火箭成功发射，将6颗卫星送入预定轨道。此次任务中，国产时序数据库IoTDB为火箭试验和卫星运行提供了关键技术支撑：1）为火箭发动机热试车数据提供高效存储与分析能力，实现研发效率提升；2）支持北邮二号、三号卫星实现星间数据互备、星地协同等创新功能，构建高可用太空数据库。这标志着国产时序数据库在航天级场景中的卓越性能，为太空领域数据管理开辟了新路径。

蓝箭航天遥二运载火箭商业航天
AI机器人赛道竞速，英伟达/微美全息GPU+AI全栈布局双轮驱动产业化浪潮！

英伟达CEO黄仁勋在Computex2025电脑展发表主题演讲，宣布公司转型为AI基础设施提供商。重点展示了四大方向：消费级RTX显卡、B300服务器芯片、Omniverse软件平台及自动驾驶/机器人技术。推出全新GB300 Blackwell Ultra AI平台，提升训练和推理能力。黄仁勋强调机器人技术将引领下一场工业革命，推出Isaac GR00T机器人开发平台和Jetson Thor处理器。摩根士丹利预测人形机器人市场规模将达60万亿美元，中国到2050年市场规模或达6万亿元。微美全息等企业正加速布局该领域，通过AI视觉、自然语言处理等技术提升机器人环境感知与决策能力。黄仁勋指出智能体(Agent)、模型(Model)和机器人(Robot)将成为未来十年技术话语权争夺的关键。

AI芯片英伟达 Computex2025
我国约2.88亿部手机支持北斗定位专利申请全球领先

下一代北斗系统建成后，无论在世界上任何时间、任何地方，都有北斗、都有中国的时空体系给大家提供安全、可靠的时空技术。

卫星导航北斗系统位置服务
英伟达纵深扩展量子计算版图，微软/微美全息共发力奔赴技术革命新征程！

英伟达CEO黄仁勋在COMPUTEX2025发表主题演讲，宣布推出企业AI计算平台NVIDIA RTX PRO服务器，搭载RTX PRO6000 Blackwell GPU，专为驱动AI工厂和加速企业AI工作负载设计。同时英伟达布局量子计算，设立全球量子AI技术研发中心G-QuAT，并投资量子计算初创公司PsiQuantum。微软宣布将后量子密码学技术整合到Windows系统，谷歌高管预测量子计算应用或将在五年内实现。微美全息作为量子产业先锋，通过量子计算与AI超算融合实现技术突破。全球科技巨头正加速布局量子计算领域，英伟达引领AI产业向纵深发展，在新竞争格局下进军量子计算，押注下一代技术浪潮。

英伟达黄仁勋企业AI
英伟达最新高算力芯片上车雷军：小米YU7全系标配激光雷达

5月22日，小米正式发布YU7智能汽车，全系标配激光雷达和4D毫米波雷达。新车搭载第三代骁龙8移动平台，采用4nm工艺，显著提升运行速度，OTA升级最快仅需15分钟。配备英伟达Thor计算平台，算力达700TOPS，支持大模型上车。激光雷达探测距离200米，暗光环境下性能更强，能精准识别异形障碍物。同时应用ALD镀膜技术摄像头，有效减少眩光干扰，提升雨雾天气行车安全，实现更智能的辅助驾驶体验。

小米YU7 激光雷达骁龙8
红魔10S Pro发布：国补后4499元起搭载骁龙 8 至尊领先版

在核心配置上，红魔10S Pro系列采用了第七代真全面屏技术，屏幕尺寸达到了6.85英寸，分辨率为1.5K，为用户提供了更为广阔的视野和细腻的显示效果。该系列手机搭载了高通骁龙8至尊领先版芯片，确保了强大的运算能力和流畅的游戏体验。其中，Pro+版本更是配备了7500mAh的大容量电池和120W闪充组合，而Pro版则采用了7050mAh电池搭配80W闪充，满足了用户对于长时间游戏和快速充电

红魔10S Pro 电竞手机

热文

3 天
7天

搭载英伟达GPU，全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

突破数据库备份恢复瓶颈：华瑞指数云“无损快照”技术赋能企业数据库实现秒级数据保护

悦数图数据库一体机发布，让复杂关联计算开箱即用

技术选型别盲目：为什么很多企业用错了分布式数据库？

英伟达重夺全球市值第一头衔再度超越微软

国产时序数据库 IoTDB 全程护航朱雀二号改进型火箭试验、发射及北邮双星数据管理

AI机器人赛道竞速，英伟达/微美全息GPU+AI全栈布局双轮驱动产业化浪潮！

我国约2.88亿部手机支持北斗定位专利申请全球领先

英伟达纵深扩展量子计算版图，微软/微美全息共发力奔赴技术革命新征程！

英伟达最新高算力芯片上车雷军：小米YU7全系标配激光雷达

红魔10S Pro发布：国补后4499元起搭载骁龙 8 至尊领先版

热文

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

无缝且安全的密钥导入、导出功能将登陆苹果系统

从心脏、到血管……3D打印开启“器官替换”时代

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

苹果研究发现：AI 模型在遇到复杂难题时会“崩溃放弃”

王自如：在格力工资是以前几分之一有公开资料可查

李世石：AI不会“解读”……直觉依然属于人类！

苹果举行WWDC 25开发者大会 iOS 26更新汇总

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

苹果公布 Intel Mac 支持终止时间表，Rosetta 2 也将逐步淘汰

苹果全新AirTag即将推出：将有这几点提升

格力否认董明珠孟羽童直播是策划：就是一次很自然的会面

站长商机