行业首创！Graph RAG ：基于知识图谱的检索增强技术优势与对比

2023-08-31 10:20 · 稿源：站长之家用户

身处信息爆炸时代，如何从海量信息中获取准确全面的搜索结果，并以更直观、可读的方式呈现出来是大家期待达成的目标。传统的搜索增强技术受限于训练文本数量、质量等问题，对于复杂或多义词查询效果不佳，更无法满足 ChatGPT 等大语言模型应用带来的大规模、高并发的复杂关联查询需求。

在此背景下，悦数图数据库率先实现了与 Llama Index、LangChain 等大语言模型框架的深度适配并在行业内首次提出了 Graph RAG（基于图技术的检索增强）的概念，利用知识图谱结合大语言模型（LLM）为搜索引擎提供更全面的上下文信息，可以帮助用户以更低成本获得更智能、更准确的搜索结果。目前，悦数图数据库推出的这项技术在与向量数据库结合的领域也获得了相当不错的效果。

今天我们就一起来了解下什么是 Graph RAG 以及它与其他 RAG 技术的对比，也欢迎进入悦数图数据库官网，通过 Demo 直观感受这一功能。

传统检索增强技术的瓶颈：缺少训练数据，文本理解不足

在传统的搜索引擎中，检索结果通常是基于关键词的匹配。而随着用户对搜索比较准确度和词汇联想能力要求的提高，传统的搜索结果往往难以满足用户的实际需求，尤其是在处理复杂的问题和长尾查询时，效果会明显降低。

为了解决这类问题，RAG 搜索增强技术应运而生。RAG （Retrieval-Augmented Generation），指的是通过 RAG 模型来对搜索结果进行增强的过程。具体来说，它是将检索技术和语言生成技术相结合来增强生成过程的一种技术，可以帮助传统搜索引擎生成更加准确、相关和多样化的信息来满足用户的需求。

而为了使搜索结果更准确，RAG 技术仍然面临训练数据和文本理解的挑战：

训练数据：RAG 技术需要大量的数据和计算资源来训练和生成模型，尤其是在处理多语言和复杂任务时，但是互联网上文本的质量和准确性是有限的，训练数据的不足会直接影响生成内容的质量
文本理解：RAG 需要理解查询的意图，但是对于复杂的查询或者多义词查询，RAG 可能会出现歧义或不确定性，从而影响生成的质量

因此，如何找到更强大的检索增强技术，以更有效率获得更符合搜索者的预期的搜索结果的问题就显得更迫在眉睫。

什么是 Graph RAG：基于知识图谱的检索增强技术

「Graph RAG」是由悦数图数据率先提出的概念，它是一种基于知识图谱的检索增强技术，通过构建图模型的知识表达，将实体和关系之间的联系用图的形式进行展示，然后利用大语言模型 LLM（Large Language Model）进行检索增强。

在之前和 Llama Index 的直播研讨会中我们提到，图数据库凭借图形格式组织和连接信息的方式，天然适合存储及表达复杂的上下文信息。通过图技术构建知识图谱提升 In-Context Learning 的全面性为用户提供更多的上下文信息，能够帮助大语言模型（LLM）更好地理解实体间的关系，提升自己的表达和推理能力。

Graph RAG 将知识图谱等价于一个超大规模的词汇表，而实体和关系则对应于单词。通过这种方式，Graph RAG 在检索时能够将实体和关系作为单元进行联合建模，从而更准确地理解查询意图，并提供更准确的检索结果。

Demo 演示：检索强化效果对比：「悦数」官网可直接在线体验

下面我们就通过 Demo 演示来直观比较下 Graph RAG 与 Vector RAG、Text2Cypher 这三种检索增强技术的区别和对比——

Vector RAG 与 Graph + Vector RAG 的对比

首先是 Vector RAG（向量检索）与 Graph + Vector RAG（图技术增强的向量检索）的对比。

以《银河护卫队 3》的数据集为例，当我们询问“彼得·奎尔的相关信息”时，单独使用向量检索引擎只给出了简单的身份、剧情、演员信息，而当我们使用 Graph RAG 增强后的搜索结果，则提供了更多关于主角技能、角色目标和身份变化的信息——在这个例子中我们不难看出， Graph RAG 的方法有效补充了 Embedding、向量搜索等传统手段的不足。

Graph RAG 与 Text2Cypher 的对比

基于图谱的 LLM 的另一种有趣方法是 Text2Cypher，即自然语言生成图查询。这种方法不依赖于实体的子图检索，而是将任务/问题翻译成一个面向答案的特定图查询，和我们常说的 Text2SQL 本质是一样的。

Text2Cypher 和 Graph RAG 这两种方法主要在其检索机制上有所不同。Text2Cypher 根据知识图谱的 Schema 和给定的任务生成图形模式查询，而（Sub）Graph RAG 获取相关的子图以提供上下文。两者都有其优点，大家可以通过这个 demo ，更直观理解他们的特点：

我们可以看到两者的图查询模式在可视化下是有非常清晰的差异的，基于 Graph RAG 实现的检索明显呈现出更丰富的结果。用户不仅获得了最基础的介绍信息，更能得到“彼得·奎尔是银河护卫队的领导者”、“这个角色暗示自己将在续集中回归”以及角色性格等一系列基于关联搜索和上下文进行推理得出的结果。

悦数图数据库：率先实现 LLM 适配，一键构建企业专属知识图谱应用

悦数图数据库不仅是国内头家提出 Graph RAG 概念的厂商，也率先实现了与大语言模型框架 Llama Index 、LangChain 等的深度适配，因此开发者可以专注于 LLM 的编排逻辑和 pipeline 设计，而不用亲自处理很多细节的抽象与实现，一站式生成高质量、低成本的企业级大语言模型应用。

Graph RAG 技术的出现可以说是为海量信息处理和检索带来了全新的思路。通过将知识图谱、图存储集成到大语言模型（LLM）技术栈中，Graph RAG 把上下文学习推向了一个新的高度。目前，用户基于悦数图数据库仅需要 3 行代码就可以轻松搭建 Graph RAG，甚至整合更复杂的 RAG 逻辑，比如 Graph+Vector RAG。

选择相信随着图技术和深度学习算法的进一步发展，Graph RAG 技术在信息处理和检索领域的应用也会越来越广泛。欢迎大家联系我们获取悦数图数据的免费试用机会，轻松构建您的专属知识图谱应用！

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
入选《SD-WAN产业图谱》白山云持续加深自身底蕴

在快速发展的数字时代，边缘计算作为新兴技术领域，正逐渐成为引领行业创新的重要力量。白山云凭借其卓越的技术实力和产品创新，成功入选中国信通院《SD-WAN产业图谱》，标志着其在边缘云领域的深厚底蕴和广泛认可。白山云入选《SD-WAN产业图谱》是荣誉也是鞭策，未来，白山云将继续保持创新活力，推动边缘计算技术的发展和应用，为构建数字化社会贡献力量。

边缘计算白山云 SD-WAN产业图谱
新机器学习框架DRAGIN:用于大语言模型中的动态检索增强，胜过传统方法

研究人员从清华大学和北京理工大学开发了DRAGIN，这是一种针对大型语言模型设计的动态检索增强生成框架。该框架旨在通过在文本生成过程中实时确定何时以及如何检索外部信息，从提高语言模型的性能。未来的工作旨在克服与自注意力可访问性相关的限制，并对查询构建技术的影响进行评估。

DRAGIN AI头条
RockAI参与上海AIGC行业技术沙龙揭晓RAG商业化之路

为进一步推动上海AIGC行业的交流与合作，促进技术创新和应用落地，4月25日，由上海市人工智能行业协会主办的“龙腾启新·AI创未来”上海AIGC行业技术沙龙圆满举行。岩山科技旗下上海岩芯数智受邀参与并发表了《RockAIRAG商业化之路》的主题分享，详解其在AIGC领域的最新研究成果及商业化进程，引起了与会者的广泛关注。相信RockAI将继续发挥自身优势，通过技术创新推动AIGC技术的商业化进程，与各界伙伴携手，为人工智能行业的健康、长远发展注入新的动力。

上海AIGC行业技术沙龙人工智能
中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

“你好，新应用!”站在大模型落地元年，是时候喊出这句话了。这份榜单能够为理解中国AIGC应用趋势提供一个客观视角，也希望它能成为AIGC革命浪潮中的一个新注脚。这份榜单能够为理解中国AIGC应用趋势提供一个客观视角，也希望它能成为AIGC革命浪潮中的一个新注脚。

AI应用 AIGC技术智能终端
明源云入选AIGC图谱展现不动产数智营销最新成果

4月17日，第二届中国AIGC产业峰会在北京召开，峰会聚集了行业产学研投代表，分享关于最新生成式AI现状与趋势的见解。峰会现场发布了《中国AIGC应用全景报告》，对当下AIGC应用市场绘制了一幅全面立体的应用全景图。随着AIGC技术的不断成熟和应用的不断拓展，明源云作为不动产行业智能化转型的重要推动者之一，将始终坚持以客户需求为导向，不断创新产品与服务，推动不动产行业的数字化、智能化发展。

人工智能 AIGC 视频营销
“动态排版”技术Dynamic Typography 可将文本字母转化为动画

一种名为DynamicTypography的创新“动态排版”技术，正在为文本表达开辟新天地。这项技术通过视频扩散先验，将文本字母转化为动画，从增强语义表达和动态效果。利用向量图形技术，动画在任何分辨率下都能保持高质量，同时用户可以轻松调整文本样式。

DynamicTypography AI头条
受访Cointelegraph 孙宇晨解析比特币减半影响及加密技术未来

特别是比特币减半对市场的潜在影响、区块链技术的未来走向，以及模因币的市场地位等关键问题。
荐因为一个Rapper，成都有了自己的迪士尼。

成都一个。无论之后如何，在2024年的中文互联网上，诺米都曾成为过一个“Rapstar”。

Rapper
行业首创漂移模式！小米汽车：针对具备专业驾驶经验的用户打造

在小米汽车最新更新的《小米SU7答网友问》中，小米汽车对SU7搭载的漂移模式进行了解答。官方表示：针对小米SU7Max的漂移模式”使用场景是否有限制。小米SU7提供了自定义驾驶模式，可通过调节动力响应、前驱后驱分配比例、ESC稳定辅助控制、TC牵引力控制等多项设置来实现漂移状态。

小米汽车小米SU7 漂移模式
Cohere 发布 Rerank 3，集成企业搜索和 RAG 功能

Cohere发布了Rerank3，这是一款新的基础模型，旨在增强企业搜索和检索增强生成系统。这一新模型将改变企业处理和访问大量数据的方式，提高搜索效率和准确性。”Elasticsearch的GVP兼总经理MattRiley表示。

Cohere Rerank3 AI头条

今日大家都在搜的词：

热文

3 天
7天

行业首创 ！Graph RAG ：基于知识图谱的检索增强技术优势与对比

今日大家都在搜的词：

热文

站长商机

行业首创！Graph RAG ：基于知识图谱的检索增强技术优势与对比