首页 > 业界 > 关键词  > 大语言模型最新资讯  > 正文

​IBM Research发布SimPlan:采用混合方法加强LLM在规划任务中的能力

2024-03-08 09:24 · 稿源:站长之家

**划重点:**

1. 🤖 SimPlan是IBM Research的创新之举,采用混合方法加强大语言模型(LLMs)在规划任务中的能力。

2. 🔄 SimPlan通过引入双编码器模型和贪婪最佳优先搜索算法,成功解决了LLMs在规划中的局限性,在各种规划领域表现出卓越效果。

3. 🌐 该技术突破为人工智能应用开辟了新的可能性,将经典规划技术与先进的自然语言处理能力相结合,为未来创建更可靠和复杂的人工智能系统奠定了基础。

站长之家(ChinaZ.com)3月8日 消息:设计在特定环境中实现目标的一系列操作是测试人工智能能力和规划能力的重要标志。传统上,这一领域通过算法来制定潜在的操作序列,以寻找最优解,对于从机器人到自动决策系统等应用至关重要。然而,大语言模型(LLMs)在这些规划任务中的局限性一直是一个重要障碍。尽管LLMs在解析和理解大片自然语言方面表现出色,但它们在规划中往往需要帮助,难以准确建模环境内行动的效果或有效地探索状态空间。

image.png

IBM Research的研究人员通过开发“SimPlan”来直面这个问题,这是一种混合方法,旨在通过将它们与传统规划策略相结合,加强LLMs的规划能力。SimPlan是一项开创性的工作,旨在弥合LLMs语言技能和传统规划算法的结构化、基于规则的方法之间的差距。该方法旨在利用LLMs的自然语言技能,同时通过更纪律化、算法化的方式纠正它们在规划场景中的缺陷。

SimPlan创新的核心是一种双编码器模型,旨在根据当前状态和定义的目标对可能的操作进行排名,直接解决了在规划场景中识别相关操作的挑战。该模型利用了后交互架构,通过计算查询和上下文中个别标记之间的余弦相似性,增强了其预测能力,而不是依赖于池化表示。系统使用交叉熵损失来优化行动选择过程,将排名最高的行动与黄金下一行动进行比较,并引入负面示例以防止行动表示崩溃。

SimPlan还引入了贪婪最佳优先搜索(GBFS)算法的新颖用法,与通常在自然语言生成中使用的传统束搜索方法不同。这种选择是由GBFS算法更有效地探索状态空间的能力所驱动的,其重点是探索高潜力路径,而不是优化本地序列。这种战略性的转变旨在增强模型预测行动的影响并将其序列化朝着设定的目标更为优化地进行。

SimPlan在各种规划领域的性能评估显示,与现有的基于LLMs的规划器相比,其效果显著。广泛的实验证明,SimPlan在解决复杂规划问题时比其前身表现出色,以卓越的准确性和效率解决了问题。例如,在不同规划场景的测试中,SimPlan在简单配置中实现了100%的成功率,并在复杂环境中保持了卓越的性能,远远超过传统的基于LLMs的方法。具体而言,在传统规划器无法胜任的复杂问题实例中,SimPlan的混合方法展现出其强大之处,以娴熟的方式穿越复杂的规划挑战。

IBM Research的这一突破突显了混合方法在增强LLMs规划能力方面的潜力。它为需要复杂问题解决和决策能力的人工智能应用设定了新的基准。通过解决长期以来困扰LLMs在规划任务中的关键挑战,SimPlan为在各种复杂场景中部署人工智能开辟了新的可能性。SimPlan的成功强调了将经典规划技术与LLMs的先进自然语言处理能力相结合的重要性,为未来创造更可靠、复杂的人工智能系统打开了大门。

IBM Research团队开发的SimPlan标志着人工智能规划的重大飞跃。通过其创新的混合方法,SimPlan不仅克服了LLMs在规划任务中的固有限制,还宣告了一种能够应对各个行业中复杂决策和问题解决挑战的人工智能应用新时代的到来。IBM Research团队的工作强调了将经典规划方法与LLMs先进能力相结合的转变潜力,为未来创造更可靠和复杂的人工智能系统奠定了基础。

举报

  • 相关推荐
  • 三星在CES 2025发布采用创新AI混合制冷技术的新款冰箱

    摘要:这款创新冰箱采用了颠覆传统制冷方式的Peltier模块[1]借助AI算法实现了高效的能源利用,延长了食品的保鲜期并提供了更大的内部空间。正文:2024年12月19日,三星电子宣布将在2025年国际消费类电子产品展览会上公布采用AI混合制冷技术的新款冰箱,该冰箱计划于2025年在全球上市。12、基于一个容量为355毫升、尺寸为66x122毫米的罐装饮料。

  • impact 全球生态持续拓展,引领作伙伴营销新篇章

    在技术快速进步与消费者主导趋势下,全球营销格局正在经历深刻变革。消费者从品牌驱动逐渐转向社群驱动,信任和真实性成为品牌脱颖出的关键因素。想要了解impact.com的技术平台与合作伙伴营销项目如何推动沃尔玛、优步、Shopify、联想、欧莱雅、Fantatics、Levi’s和1-800-Flowers等全球企业品牌的收入增长,请访问www.impact.com。

  • 变废为宝!新款Apple Watch SE将采用海洋回收塑料材质

    苹果计划在新款AppleWatchSE中采用环保再生塑料材质。这种材料来源于海洋回收的塑料,这将使其成为苹果首款负碳产品,这也体现了苹果在环保领域的持续努力。苹果公司一直致力于环保创新,此次在AppleWatchSE中引入海洋回收塑料材质,进一步展示了其对可持续发展的承诺。

  • 史无前例!第三代Apple Watch SE将采用彩色塑料外壳:价格更亲民

    据彭博社记者MarkGurman透露,苹果计划在今年晚些时候推出第三代AppleWatchSE。新款手表将首次采用彩色塑料外壳,这一变革预计将显著降低成本,使价格更加亲民。随着发布日的临近,新一代AppleWatchSE有望成为市场上最具竞争力的智能手表之一。

  • 正式发布还有4天:用户竟提前买到两块Intel Arc 570显卡!

    今天有海外用户分享了一张照片,称他从当地MicroCenter分店购买到了两块IntelArcB570显卡。Intel第二代独立显卡首发B580、B570两款型号,B580已经上市开售规格稍低一点的B570计划在1月16日上架,评测解禁按惯例是1月15日晚。此前在2024年12月的时候,就有用户提前一个月收到了华擎IntelArcB570Challenger10GBOC显卡,他还通过一系列手段,为这款显卡安装上B580驱动并成功运行。

  • CES 2025:三星持续拓展“AI for All”愿景,致力于将AI融入日常生活中的方方面面

    摘要:三星发展战略再升级,通过HomeAI提升用户在家庭及更多场景中的智能体验2025年1月6日,三星电子于CES®2025发布了全新的“AIforAll”愿景,致力于让AI体验覆盖到用户日常生活的方方面面。依托数十年来在互联家居生态上的领先表现,三星充分发挥AI技术优势,赋能日常生活,让用户体验更具个性化、更有影响力和更加自主的世界。###关于三星电子三星以不断创新的思想与技术激励世界、塑造未来,重新定义电视、智能手机、可穿戴设备、平板电脑、家用电器、网络系统、存储、系统集成电路、半导体代工制造及LED解决方案,通过SmartThings生态系统、开放的合作伙伴关系,提供无缝连接体验。

  • CES 2025:三星持续拓展“AI for All”愿景,致力于将AI融入日常生活中的方方面面

    摘要:三星发展战略再升级,通过HomeAI提升用户在家庭及更多场景中的智能体验2025年1月6日,三星电子于CES®2025发布了全新的“AIforAll”愿景,致力于让AI体验覆盖到用户日常生活的方方面面。依托数十年来在互联家居生态上的领先表现,三星充分发挥AI技术优势,赋能日常生活,让用户体验更具个性化、更有影响力和更加自主的世界。关于三星电子三星以不断创新的思想与技术激励世界、塑造未来,重新定义电视、智能手机、可穿戴设备、平板电脑、家用电器、网络系统、存储、系统集成电路、半导体代工制造及LED解决方案,通过SmartThings生态系统、开放的合作伙伴关系,提供无缝连接体验。

  • Check Point:Banshee Stealer 将目标瞄准 macOS 用户

    macOS相关产品由于其整体市场份额占比不高,以及系统较为封闭的原因,用户普遍认为相对于Windows生态,macOS更加安全。随着macOS越来越受欢迎,在全球已拥有超过1亿活跃用户。通过及时了解最新信息并投资强大的网络安全措施,企业用户可以有效保护其数据并灵活应对这些威胁。

  • 贾跃亭全新品牌FX官宣!首款MPV车型谍照正式发布

    FaradayFuture第二品牌FaradayX通过线上直播发布了两款原型车及品牌标志,FX首款车型为MPV,第二款为FX6,预计FX6具有SUV定位。FXMPV计划今年第二季度发布,FX6将在3月公布更多信息。FX品牌目标成为人工智能电动车市场的丰田”,面向大众市场,非FF品牌的顶级奢华领域。

  • OpenAI智能体曝本月诞生!比谷歌Anthropic慢,竟是担心prompt攻击

    【新智元导读】就在刚刚,OpenAI在智能体上落后竞争对手的原因曝光了!2025年,智能体将是AI领域最激烈的战场。一直在AI领域「独占鳌头」的OpenAI,却迟迟没有出手。这一点或许说明了,此类初创公司很难在安全发展AI与为股东创造利润之间取得平衡。