首页 > 传媒 > 关键词  > 正文

行业首创 !Graph RAG :基于知识图谱的检索增强技术优势与对比

2023-08-31 10:20 · 稿源: 站长之家用户

身处信息爆炸时代,如何从海量信息中获取准确全面的搜索结果,并以更直观、可读的方式呈现出来是大家期待达成的目标。传统的搜索增强技术受限于训练文本数量、质量等问题,对于复杂或多义词查询效果不佳,更无法满足 ChatGPT 等大语言模型应用带来的大规模、高并发的复杂关联查询需求。

在此背景下,悦数图数据库率先实现了与 Llama Index、LangChain 等大语言模型框架的深度适配并在行业内首 次提出了 Graph RAG(基于图技术的检索增强)的概念,利用知识图谱结合大语言模型(LLM)为搜索引擎提供更全面的上下文信息,可以帮助用户以更低成本获得更智能、更准确的搜索结果。目前,悦数图数据库推出的这项技术在与向量数据库结合的领域也获得了相当不错的效果。

今天我们就一起来了解下什么是 Graph RAG 以及它与其他 RAG 技术的对比,也欢迎进入 悦数图数据库 官网,通过 Demo 直观感受这一功能。

传统检索增强技术的瓶颈:缺少训练数据,文本理解不足

在传统的搜索引擎中,检索结果通常是基于关键词的匹配。而随着用户对搜索比较准确度和词汇联想能力要求的提高,传统的搜索结果往往难以满足用户的实际需求,尤其是在处理复杂的问题和长尾查询时,效果会明显降低。

为了解决这类问题,RAG 搜索增强技术应运而生。RAG (Retrieval-Augmented Generation),指的是通过 RAG 模型来对搜索结果进行增强的过程。具体来说,它是将检索技术和语言生成技术相结合来增强生成过程的一种技术,可以帮助传统搜索引擎生成更加准确、相关和多样化的信息来满足用户的需求。

而为了使搜索结果更准确,RAG 技术仍然面临训练数据和文本理解的挑战:

  • 训练数据:RAG 技术需要大量的数据和计算资源来训练和生成模型,尤其是在处理多语言和复杂任务时,但是互联网上文本的质量和准确性是有限的,训练数据的不足会直接影响生成内容的质量

  • 文本理解:RAG 需要理解查询的意图,但是对于复杂的查询或者多义词查询,RAG 可能会出现歧义或不确定性,从而影响生成的质量

因此,如何找到更强大的检索增强技术,以更有效率获得更符合搜索者的预期的搜索结果的问题就显得更迫在眉睫。

什么是 Graph RAG:基于知识图谱的检索增强技术

「Graph RAG」是由悦数图数据率先提出的概念,它是一种基于知识图谱的检索增强技术,通过构建图模型的知识表达,将实体和关系之间的联系用图的形式进行展示,然后利用大语言模型 LLM(Large Language Model)进行检索增强。

在之前 和 Llama Index 的直播研讨会 中我们提到,图数据库凭借图形格式组织和连接信息的方式,天然适合存储及表达复杂的上下文信息。通过图技术构建知识图谱提升 In-Context Learning 的全面性为用户提供更多的上下文信息,能够帮助大语言模型(LLM)更好地理解实体间的关系,提升自己的表达和推理能力。

Graph RAG 将知识图谱等价于一个超大规模的词汇表,而实体和关系则对应于单词。通过这种方式,Graph RAG 在检索时能够将实体和关系作为单元进行联合建模,从而更准确地理解查询意图,并提供更准确的检索结果。

Demo 演示:检索强化效果对比:「悦数」官网可直接在线体验

下面我们就通过 Demo 演示来直观比较下 Graph RAG 与 Vector RAG、Text2Cypher 这三种检索增强技术的区别和对比——

Vector RAG 与 Graph + Vector RAG 的对比

首先是 Vector RAG(向量检索) 与 Graph + Vector RAG(图技术增强的向量检索)的对比。

以《银河护卫队 3》的数据集为例,当我们询问“彼得·奎尔的相关信息”时,单独使用向量检索引擎只给出了简单的身份、剧情、演员信息,而当我们使用 Graph RAG 增强后的搜索结果,则提供了更多关于主角技能、角色目标和身份变化的信息——在这个例子中我们不难看出, Graph RAG 的方法有效补充了 Embedding、向量搜索等传统手段的不足。

Graph RAG 与 Text2Cypher 的对比

基于图谱的 LLM 的另一种有趣方法是 Text2Cypher,即自然语言生成图查询。这种方法不依赖于实体的子图检索,而是将任务/问题翻译成一个面向答案的特定图查询,和我们常说的 Text2SQL 本质是一样的。

Text2Cypher 和 Graph RAG 这两种方法主要在其检索机制上有所不同。Text2Cypher 根据知识图谱的 Schema 和给定的任务生成图形模式查询,而 (Sub)Graph RAG 获取相关的子图以提供上下文。两者都有其优点,大家可以通过这个 demo ,更直观理解他们的特点:

我们可以看到两者的图查询模式在可视化下是有非常清晰的差异的,基于 Graph RAG 实现的检索明显呈现出更丰富的结果。用户不仅获得了最基础的介绍信息,更能得到“彼得·奎尔是银河护卫队的领导 者”、“这个角色暗示自己将在续集中回归”以及角色性格等一系列基于关联搜索和上下文进行推理得出的结果。

悦数图数据库:率先实现 LLM 适配,一键构建企业专属知识图谱应用

悦数图数据库不仅是国内头家提出 Graph RAG 概念的厂商,也率先实现了与大语言模型框架 Llama Index 、LangChain 等的深度适配,因此开发者可以专注于 LLM 的编排逻辑和 pipeline 设计,而不用亲自处理很多细节的抽象与实现,一站式生成高质量、低成本的企业级大语言模型应用。

Graph RAG 技术的出现可以说是为海量信息处理和检索带来了全新的思路。通过将知识图谱、图存储集成到大语言模型(LLM) 技术栈中,Graph RAG 把上下文学习推向了一个新的高度。目前,用户基于悦数图数据库 仅需要 3 行代码就可以轻松搭建 Graph RAG,甚至整合更复杂的 RAG 逻辑,比如 Graph+Vector RAG。

选择相信随着图技术和深度学习算法的进一步发展,Graph RAG 技术在信息处理和检索领域的应用也会越来越广泛。欢迎大家联系我们获取悦数图数据的免费试用机会,轻松构建您的专属知识图谱应用!

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 攻克“癌症之王”难题!我国专家成功绘制全球首份“多组学全景图谱

    中国医学专家历经五年研究,成功绘制出全球首张无功能性胰腺神经内分泌瘤多组学全景图谱。基于该图谱,专家们创新性提出针对这种沉默肿瘤”的分子分型框架、预后模型及靶向-免疫治疗新策略,为临床精准诊疗提供了重要参考。更具临床应用价值的是,研究团队发现相关蛋白在患者血浆中的浓度与肿瘤进展显著相关,这一突破性发现或将推动诊疗模式从传统的有创组织活检”向无创血液检测”转变。

  • 纳米AI上线“知识广场”,个人知识管理和专创作进一步增强

    4月1 日,纳米AI迎来全新升级,个人知识库的高阶功能知识广场上线并开放,知识广场包含考研真题、合同模板、法律文书、财税知识、爆款短视频脚本等垂直专业内容,用户可以立取立用。这意味着大模型驱动的知识库作为用户的“第二大脑”,能力边界进一步扩展,用户进行知识管理、专业创作与大模型协作的效率再次提升。你的思考、阅览、工作痕迹,不需要一遍遍复盘,可以更高效地完成专业范围内的创造性工作。

  • 银发经济浪潮下,量子之歌多元化布局与技术革新共新篇

    在全球数字化浪潮的推动下,量子之歌正以其稳健的运营和持续的创新,在银发经济领域书写着令人瞩目的新篇章。不同于传统教育企业,量子之歌不仅专注于现有课程内容的升级优化,更展现出在多元化业务布局上的前瞻性和执行力,为银发族提供了丰富多样的学习与生活选择。近年来,量子之歌的在线学习业务稳健发展,课程内容不断优化。其中,金融素养课程经过深度�

  • 追觅扫地机全球第一!以首创技术解决清洁困扰

    日前,追觅扫地机获得沙利文“智能拖布拆卸地毯保护扫地机器人,2022- 2024 三年累计全球销量第一”专业认证。追觅科技在 2022 年发布的追觅X10 系列扫地机器人产品上率先搭载智能拖布拆卸技术,核心解决扫地机器人清洁过程中对地面、地毯造成的二次污染情况,为扫地机器人行业的清洁能力提升起到了关键引领作用。最初的扫拖一体机器人从扫拖一体或拖地模式切换到扫�

  • 麦德通AI外观检索工具怎么用?

    跨境电商卖家面临外观专利侵权风险,占比高达62%的侵权案件。麦德通推出AI外观检索工具,提供图片检索和关键词检索两种方式,3秒内精准匹配全球专利风险。首月限时免费使用,支持多图检索、智能联想功能,帮助卖家规避侵权风险。工具操作简单,非专业人士也能快速上手,可筛选有效专利结果。麦德通还提供商标检索等知识产权全链路服务,助力卖家提高品牌注册成功率。

  • 麦德通重磅推出「AI外观检索」工具!

    在企业全球化布局进程中,除持续强化产品创新研发外,更需应对外观专利等知识产权布局及侵权风险的挑战,为了助力企业更好的防范风险,麦德通继「AI商标起名」工具后再次领先行业正式推出行业首创「AI外观检索」工具!基于全球171个受理局近2亿外观数据库和前沿AI智能技术,为品牌安全构筑有力保障!我们将持续引领行业变革,成为企业应对国际知识产权风险的的强�

  • GTA增强版登录XGP免费玩!XGP怎么免费玩GTA增强

    GTA增强版上线XGP了,GTA增强版可以说是让我们的老朋友焕发了新的生机,更顶尖的游戏画面,更丰富的游戏内容,一定给各位新老朋友带来更好地体验。上XGP之后,我们的游玩也是多了一个新的选择,在XGP中入手会员就能免费玩GTA增强版,还有XGP的其他游戏,整体算起来还是比较优惠的,今天教大家XGP怎么免费玩GTA增强版。在XGP上玩游戏,要先优化网络,作为一款外服平台,�

  • 技术破界 × 空气革命:绿岛风以数智化生态重构新风行业价值坐标

    在"双碳"战略与健康人居需求的双重驱动下,新风行业迎来结构性变革的黄金窗口期。2013-2020年间,我国新风行业销售额年均复合增长率超30%,预计2025年市场规模将突破600亿元。智能化、节能化及场景适配化成为推动行业技术迭代的关键力量,物联网技术与AI算法的深度融合正引领新风设备从单一通风向全屋空气管理生态升级。绿岛风凭借前瞻性技术布局与全产业链协同优势,迅速占据市场领先地位,构建起覆盖家用、商用、工业三大场景的产品矩阵,通过自主研发的智能控制系统实现空气质量的动态优化。企业以490项专利构筑技术壁垒,坚持"专注、务实、创新、责任、奋斗"理念,市场份额稳步提升,成为行业"隐形冠军"。2024年除湿机产销量同比增幅均超38%,成为企业第二增长曲线。绿岛风将通过构建空气价值生态系统,在2025中国制冷展上展示技术实力,开启行业高质量发展新篇章。(140字)

  • 困局即是机遇:IBM 以‘咨询+技术’双引擎助力中国汽车行业从跟跑到领跑

    IBM聚焦汽车行业数字化转型,通过“咨询+技术”模式助力车企构建端到端智能生态系统,推动业务持续创新与升级。重点提及AI在提升效率、优化成本及创造价值方面的潜力,并强调数据驱动的智能化转型战略。同时,IBM展示其在全球范围内的丰富经验和成功案例,提出未来将以AI为核心加速行业变革。

  • 技术革新下的行业新王诞生,坚果N3成4K段位全能投影

    2024年,家用投影行业迎来了里程碑式的革新,坚果投影推出N3系列三款新品。N3UltraMax凭借纯三色激光、真光学变焦、AI全智控云台等核心技术突破,带来了亮度、色彩、智能体验的全面升级,成为万元内投影市场的“性能天花板”,重新定义了家用投影的行业标准。其带来的不仅是销量数字,更是一个行业的价值重构——当“参数内卷”被“体验至上”取代,当“价格战”被“技术战”终结,家用投影产业的黄金时代,或许才刚刚开始。