首页 > 业界 > 关键词  > ToG最新资讯  > 正文

IDEA提出ToG思维图谱 大模型性能提升214%!

2023-11-27 14:16 · 稿源:站长之家

要点:

  • 由IDEA研究院、微软亚洲研究院、香港科技大学等研究团队推出的Think-on-Graph技术,通过大模型与知识图谱的深度融合,实现在多个基准数据集上的性能提升,引领深度推理领域。

  • 在解决大模型在金融、法律、医疗等领域幻觉问题的挑战中,Think-on-Graph通过紧耦合的方式将大模型(LLM)作为“跑腿”,与知识图谱(KG)相互协作,提供更条理清晰、可追溯的推理链条。

  • Think-on-Graph借鉴了Transformer的beam-search算法思路,通过搜索剪枝和推理决策两个任务的迭代过程,有效提升了大模型推理的可解释性,同时在多个任务上刷新性能榜单。

站长之家(ChinaZ.com)11月27日 消息:近期,由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术,在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型(LLM)与知识图谱(KG),成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。Think-on-Graph被证明在多个基准数据集上实现了巨大的性能提升,刷新了相关领域的性能榜单。

为了解决大模型在幻觉问题上的挑战,Think-on-Graph采用了紧耦合的新范式,将大模型作为“跑腿”与知识图谱相互协作。这一方法不仅使推理过程更加清晰有序,还提供了可追溯的推理链条。通过一个具体的例子,对比了传统大模型在推理问题上的表现与Think-on-Graph的方式,突显了其在逻辑分析和推理透明度方面的优势。

image.png

论文地址:https://arxiv.org/pdf/2307.07697.pdf

代码链接:https://github.com/IDEA-FinAI/ToG

Think-on-Graph的紧耦合范式不仅提高了大模型推理的效率,还在可解释性上有所突破。采用了Transformer的beam-search算法思路,实现了搜索剪枝和推理决策的迭代过程,有效提升了大模型推理的可解释性。此外,通过人工反馈和大模型的推理能力,Think-on-Graph还能够发现并修正知识图谱中的错误信息,弥补了大模型训练时间长、知识更新慢的缺点。

最终,在四类知识密集型任务的共9个数据集上,Think-on-Graph不仅刷新了7个性能榜单,而且在Zeroshot-RE数据集上的表现更是显著超过了传统大模型。这一研究成果为深度推理领域的发展带来了新的思路和方法,为实现大模型在各领域应用中更可靠、可解释的推理能力提供了有力支持。

举报

  • 相关推荐
  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

  • LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖,以科学创新推动脑健康产业升级

    LIFETOO品牌凭借核心产品"缩醛磷脂脑活素"荣获2025年TITAN健康奖神经健康领域奖项。该成分通过高效抗氧化、调节神经功能及改善认知等机制发挥作用,动物实验显示能显著提升学习记忆能力。奖项认证了品牌在科研转化与成分应用方面的实力,为应对全球老龄化趋势下的脑健康挑战提供了科学解决方案,推动功能性食品行业向专业化发展。

  • Creators’ App迎来重大更新

    索尼与分秒帧联合推出云端影像创作平台ICE-Cloud,集成索尼先进影像技术与高效云端协作能力,为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用,实现素材自动上传、云端管理、在线审片和项目协同,打破时空限制,提升创作效率。通过Creators’ App连接相机与云端,实现即拍即传、异地实时协作,致力于打造新一代创意工作流。

  • 从“实时分账”到“智能问数”:汇付天下以“Data Agent”重塑支付业务决策效率

    汇付天下作为技术驱动的数字化企业,践行“数字化+国际化”战略,为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求,公司依托火山引擎技术,构建湖仓一体架构,实现毫秒级风控响应与实时分账,并通过Data Agent智能平台支持自然语言查询与业务归因,推动数据驱动运营。该方案以流批一体能力优化数据处理效率,保障业务稳定与合规,助力企业实现全域增长与智能化风控协同。

  • TCL华星越南基地IT产品实现量产出货,全球化布局迈入“多元共振”新阶段

    TCL华星越南基地近日实现IT产品量产,标志着其全球化布局从“单点驱动”向“多元共振”战略升级。该基地聚焦显示器与笔记本电脑生产,年产能达480万台,具备背光模组自主生产能力,并通过RBA及ISO9001认证。此举将完善全球产业链布局,提升供应链韧性,为国际客户提供更高效灵活的服务。未来TCL华星计划在越南拓展多产品线,加速显示产业全球领先升级。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • 最强Mate旗舰!华为Mate 80本月下旬亮相

    华为Mate 80系列会在11月25日前后发布,这将是史上最强Mate旗舰。 据悉,本次发布会将会推出Mate 80、Mate 80 Pro、Mate 80 Pro 和Mate 80 RS四款旗舰,其中标准版代号Voyager,支持66W有线快充;Pro、Pro 及RS版统一采用Sagittarius代号,支持100W有线充电。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

今日大家都在搜的词: