IDEA提出ToG思维图谱大模型性能提升214%！

2023-11-27 14:16 · 稿源：站长之家

要点:
由IDEA研究院、微软亚洲研究院、香港科技大学等研究团队推出的Think-on-Graph技术，通过大模型与知识图谱的深度融合，实现在多个基准数据集上的性能提升，引领深度推理领域。
在解决大模型在金融、法律、医疗等领域幻觉问题的挑战中，Think-on-Graph通过紧耦合的方式将大模型（LLM）作为“跑腿”，与知识图谱(KG)相互协作，提供更条理清晰、可追溯的推理链条。
Think-on-Graph借鉴了Transformer的beam-search算法思路，通过搜索剪枝和推理决策两个任务的迭代过程，有效提升了大模型推理的可解释性，同时在多个任务上刷新性能榜单。

站长之家（ChinaZ.com）11月27日消息:近期，由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术，在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型（LLM）与知识图谱(KG)，成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。Think-on-Graph被证明在多个基准数据集上实现了巨大的性能提升，刷新了相关领域的性能榜单。

为了解决大模型在幻觉问题上的挑战，Think-on-Graph采用了紧耦合的新范式，将大模型作为“跑腿”与知识图谱相互协作。这一方法不仅使推理过程更加清晰有序，还提供了可追溯的推理链条。通过一个具体的例子，对比了传统大模型在推理问题上的表现与Think-on-Graph的方式，突显了其在逻辑分析和推理透明度方面的优势。

论文地址:https://arxiv.org/pdf/2307.07697.pdf

代码链接:https://github.com/IDEA-FinAI/ToG

Think-on-Graph的紧耦合范式不仅提高了大模型推理的效率，还在可解释性上有所突破。采用了Transformer的beam-search算法思路，实现了搜索剪枝和推理决策的迭代过程，有效提升了大模型推理的可解释性。此外，通过人工反馈和大模型的推理能力，Think-on-Graph还能够发现并修正知识图谱中的错误信息，弥补了大模型训练时间长、知识更新慢的缺点。

最终，在四类知识密集型任务的共9个数据集上，Think-on-Graph不仅刷新了7个性能榜单，而且在Zeroshot-RE数据集上的表现更是显著超过了传统大模型。这一研究成果为深度推理领域的发展带来了新的思路和方法，为实现大模型在各领域应用中更可靠、可解释的推理能力提供了有力支持。

（举报）

相关推荐

关键词：

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端，于2023年9月首次发布，由刘德华代言。新款采用18K黄金材质，设计灵感源自航海轮舵，表圈手工镶嵌六颗黄金，搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计，尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理，智能模式下续航达8天。新品将于11月15日10:08开启预售，面向追求高端独特风格的消费者。

华为WATCH ULTIMATE DESIGN
LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖，以科学创新推动脑健康产业升级

LIFETOO品牌凭借核心产品"缩醛磷脂脑活素"荣获2025年TITAN健康奖神经健康领域奖项。该成分通过高效抗氧化、调节神经功能及改善认知等机制发挥作用，动物实验显示能显著提升学习记忆能力。奖项认证了品牌在科研转化与成分应用方面的实力，为应对全球老龄化趋势下的脑健康挑战提供了科学解决方案，推动功能性食品行业向专业化发展。

TITAN健康奖缩醛磷脂脑活素神经健康
Creators’ App迎来重大更新

索尼与分秒帧联合推出云端影像创作平台ICE-Cloud，集成索尼先进影像技术与高效云端协作能力，为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用，实现素材自动上传、云端管理、在线审片和项目协同，打破时空限制，提升创作效率。通过Creators’ App连接相机与云端，实现即拍即传、异地实时协作，致力于打造新一代创意工作流。

索尼云端影像创作平台 Creators’
从“实时分账”到“智能问数”：汇付天下以“Data Agent”重塑支付业务决策效率

汇付天下作为技术驱动的数字化企业，践行“数字化+国际化”战略，为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求，公司依托火山引擎技术，构建湖仓一体架构，实现毫秒级风控响应与实时分账，并通过Data Agent智能平台支持自然语言查询与业务归因，推动数据驱动运营。该方案以流批一体能力优化数据处理效率，保障业务稳定与合规，助力企业实现全域增长与智能化风控协同。

数字化企业支付收款数据集成
TCL华星越南基地IT产品实现量产出货，全球化布局迈入“多元共振”新阶段

TCL华星越南基地近日实现IT产品量产，标志着其全球化布局从“单点驱动”向“多元共振”战略升级。该基地聚焦显示器与笔记本电脑生产，年产能达480万台，具备背光模组自主生产能力，并通过RBA及ISO9001认证。此举将完善全球产业链布局，提升供应链韧性，为国际客户提供更高效灵活的服务。未来TCL华星计划在越南拓展多产品线，加速显示产业全球领先升级。

TCL华星越南基地 IT产品
品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。
最强Mate旗舰！华为Mate 80本月下旬亮相

华为Mate 80系列会在11月25日前后发布，这将是史上最强Mate旗舰。据悉，本次发布会将会推出Mate 80、Mate 80 Pro、Mate 80 Pro 和Mate 80 RS四款旗舰，其中标准版代号Voyager，支持66W有线快充；Pro、Pro 及RS版统一采用Sagittarius代号，支持100W有线充电。

华为Mate 80 麒麟9030芯片
软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

在“软件定义汽车”浪潮下，智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而，传统软件测试模式成本高、耗时长，难以覆盖复杂场景，易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破：需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式，测试工程师角色转向质量策略师。到2027年，超80%企业将集成AI测试工具，汽车行业2025年成为转型关键节点。

软件定义汽车智能汽车座舱体验
华为WATCH Ultimate 2非凡探索版明日开启预售

华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能，具备海豚声呐通信技术，可在水下30米实现手表间信息传输，60米内一键SOS求救。同时搭载北斗卫星语音消息功能，无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕，峰值亮度达3500nit，支持20ATM防水与IP68/9防尘。省电模式下续航达11天，常规使用达4.5天。该手表海外售价799英镑（约7443元人民币），国内价格尚未公布。

华为WATCH Ultimate2 智能手表
OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理

今日大家都在搜的词：

热文

3 天
7天

IDEA提出ToG思维图谱大模型性能提升214%！

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖，以科学创新推动脑健康产业升级

Creators’ App迎来重大更新

从“实时分账”到“智能问数”：汇付天下以“Data Agent”重塑支付业务决策效率

TCL华星越南基地IT产品实现量产出货，全球化布局迈入“多元共振”新阶段

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

最强Mate旗舰！华为Mate 80本月下旬亮相

软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

华为WATCH Ultimate 2非凡探索版明日开启预售

OpenAI发布GPT-5.1：情商大涨本周开始推送

今日大家都在搜的词：

热文

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

荣耀500系列开启预约：Pro版外观首次亮相

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

苹果回应输入法宁死不屈：具备记忆功能与学习机制

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

站长商机

IDEA提出ToG思维图谱 大模型性能提升214%！

今日大家都在搜的词：

热文

站长商机

IDEA提出ToG思维图谱大模型性能提升214%！