首页 > 业界 > 关键词  > SymbCoT最新资讯  > 正文

全新推理框架SymbCoT 让大模型实现类人的符号逻辑推理能力

2024-06-07 14:48 · 稿源:站长之家

站长之家(ChinaZ.com)6月7日 消息:新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT(Symbolic Chain-of-Thought)的全新推理框架,旨在提升大语言模型(LLMs)的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链,极大提升了推理的质量、鲁棒性与可信度。SymbCoT框架已被ACL2024录用。

image.png

SymbCoT框架包含四个主要部分:翻译、规划、执行和验证。翻译模块将逻辑推理任务中的前提和结论翻译成符号化表达;规划模块根据自然语言与符号化表达生成逻辑推理计划;执行模块遵循逻辑推理规则验证结论的逻辑正确性;验证模块通过对比翻译前后的语义信息,验证翻译和执行过程中是否存在错误。

实验结果表明,SymbCoT在三个复杂逻辑推理数据集上的表现均优于传统思维链(CoT)和使用外部推理工具的方法。具体来说,在GPT3.5-turbo和GPT-4上,SymbCoT的性能分别提升了22.08%、9.31%和7.88%。此外,SymbCoT在复杂场景推理、可信度和鲁棒性方面也优于现有方法。

论文地址:https://arxiv.org/pdf/2405.18357

项目地址:https://github.com/Aiden0526/SymbCoT

SymbCoT的优势在于:

  • 复杂推理能力:SymbCoT在处理更深层次推理问题时表现更佳。

  • 鲁棒性:SymbCoT在执行符号表达式语法时的成功率显著提高,显示出对语法错误的鲁棒性。

  • 可信的逻辑推理:与传统CoT相比,SymbCoT基于严密的逻辑推理和验证,有效消除了过程中的不可信因素。

  • 符号与自然语言混合表达:SymbCoT通过结合符号和自然语言表达来纠正翻译错误并增强逻辑推理的有效性。

  • 不同LLM的影响:SymbCoT与更先进的模型(如GPT-4)之间的协同效应更为显著。

举报

  • 相关推荐
  • 梦回霸王!何润东再Cos项羽气场拉满

    何润东在抖音更新了一条趣味视频,内容是cos《王者荣耀》里的项羽,整段风格轻松搞笑,一下子吸引不少网友关注。 视频里的对话特别有意思,有人问他,哥,你真的手无缚鸡之力吗。何润东很坦然回答,是啊。对方接着追问,那十只呢,他说好像可以。再问到一百只的时候,他依旧笑着说好像还可以。短短几句问答,反差感拉满,看着又好玩又接地气。 这次他cos的项羽�

  • 一个时代的落幕!苹果macOS 27将彻底放弃Intel Mac

    早在去年的WWDC 2025开发者大会期间,苹果就已宣布, macOS 26 Tahoe将是最后一个支持Intel处理器的版本。 macOS 27开始,苹果系统将仅兼容苹果自研处理器,预计包括M全系列,以及A18的MacBook Neo。 macOS 27预计6月份推出Beta测试版,9月推送正式版。 苹果近日再次发布通知,提醒开发者注意Rosetta 2框架技术的变化。 Rosetta是苹果为了方便开发者和用户从Intel架构过渡到苹果架构的应用

  • OPPO Enco Clip 2发布:北欧丹拿调音 849元

    OPPO Enco Clip2正式发布,定价是849元。 耳夹式耳机OPPO Enco Clip2是运动、通勤场景的理想搭子”,其复刻经典耳环造型并融入全新水滴切面,一体金属质感,超闪超出片。独特的超薄自适应钛片实现了大耳不疼、小耳不松”的全天无感佩戴体验,运动场景下也稳固如初。 OPPO Enco Clip2打破耳夹式耳机音质局限,由OPPO声学团队与北欧丹拿首席调音师联合调音,支持LHDC5.0,并获得Hi-Re

  • 告别CityWalk,这届年轻人又迷上ColorWalk

    ​春天来了,这届年轻人又整新活儿了。 不是特种兵式旅行,也不是飞去某个“网红”城市打卡,玩法简单质朴:出门前在心里选定一个颜色,然后就这么走出去,走进日常街道,不设目的地,只寻找与这个颜色有关的一切。 一朵粉樱、一辆蓝单车、一块橙色招牌,甚至一个红色垃圾桶,都算“找到了”。 这就是席卷社交平台的ColorWalk。小红书上相关话题浏览量突破4.6亿次�

  • 行业首款大阔折华为Pura X Max亮相:陶瓷相机Deco

    华为Pura X Max于4月20日正式发布,号称行业首款“大阔折”。设计灵感源自A4纸,内外双屏均支持1-120Hz自适应刷新率。外屏5.4英寸、亮度达3500nits,内屏7.7英寸、亮度3000nits,带来沉浸式影音游戏体验。影像方面采用陶瓷相机Deco设计,配备5000万像素超光变主摄、5000万像素超大光圈潜望式长焦及1250万像素超广角镜头,支持XMAGE智拍与AI辅助构图。

  • MicroComputer深度评测:助力Token吞吐飙升,忆联AM6D1 PCIe 5.0 SSD击穿AI存储墙

    本文介绍了忆联AM6D1 PCIe 5.0固态硬盘,它采用4通道DRAMLess主控设计,旨在解决AI大模型本地部署中的存储瓶颈。测试显示,其顺序读写速度分别超过11400MB/s和10900MB/s,随机4K读写性能达1600K+ IOPS和1150K+ IOPS。在加载32B和235B大模型时,耗时仅10.52秒和53.99秒,游戏载入测试也表现出色。同时,其功耗控制优秀,空闲功耗可低至3mW。该产品兼顾高性能与低成本,适合从工作站到移动设备的全场景AI部署需求。

  • 仅需1/10 Token消耗!百灵Ling-2.6-flash正式发布:104B参数实现SOTA级Agent

    今日,蚂蚁百灵正式推出 Ling-2.6-flash一款总参数量 104B、激活参数 7.4B 的 Instruct 模型。该模型主打Token 效率(Token Efficiency)”,在保持竞争力智能水平的同时,更快、更省以及更适合大规模真实应用。 据权威三方评测Artificial Analysis 数据,Ling-2.6-flash 展现了突出的 Token Efficiency 优势,以 15M output tokens 实现了 26 分 的 Intelligence Index,在保持较强智能水平的同时,将输出消耗控�

  • 联想moto razr fold大折叠手机官宣5月发布

    今日,联想moto官方微博正式对外宣布,其备受期待的首款大折叠手机moto razr fold将于5月惊艳亮相。这款新机以轻薄设计为核心卖点,整机在展开状态下单边厚度仅为4.55mm至4.6mm,折叠时厚度也控制在9.89mm至9.9mm之间,机身重量更是轻至244g,为用户带来前所未有的便携体验。 moto razr fold在外屏配置上同样不遗余力,采用了一块6.6英寸的OLED屏幕,支持高达165Hz的刷新率,峰值亮度�

  • 腾讯发布浏览器龙虾QBotClaw:内置自研Skill

    今日,腾讯发布了国内首个浏览器“小龙虾”QBotClaw,这一创新产品不仅完全兼容OpenClaw技能,还支持用户自由配置国内各大主流大模型的API Key,为用户带来了前所未有的便捷体验。 腾讯方面表示,从现在起,只要用户会使用浏览器,就能立即拥有一只随时待命的“专属小龙虾”,只需简单一句话,就能让QQ浏览器自动执行任务。

  • 智显无界,AI启新!冠捷科技携旗下双品牌全场景方案闪耀北京InfoComm 2026

    2026年北京InfoComm展会上,冠捷科技旗下飞利浦与AOC品牌集中展示了AI赋能的智慧显示解决方案。飞利浦凭借多项专利技术和高品质视觉方案成为焦点,重点推出AIGC拍照机Pro版与AI字幕Mini版两款AI新品。展会围绕智慧显示、零售、交通、办公等核心场景,展示了创新方案及AI体验空间,并首发192英寸SyncPro Black COB超清显示屏等产品。AOC则聚焦可视化集控与智能运维,提供普惠集成显示方案。双品牌协同完善了集团全产品链布局,共同推动商用显示向“智能助手”演进。

今日大家都在搜的词: