首页 > 业界 > 关键词  > AI机器人最新资讯  > 正文

麻省理工学院研究:辩论让AI机器人更加聪明

2023-09-21 10:45 · 稿源:站长之家

文章概要:

1. MIT研究发现,多智能体辩论可以提高AI模型的准确性和推理能力。

2. 辩论方法减少了幻觉,帮助模型增强响应能力。

3. 研究团队发现,让多个AI系统辩论问题的答案比仅使用单个AI系统可以提高响应的准确性。

站长之家(ChinaZ.com)9月21日 消息:麻省理工学院(MIT)的研究人员发现,相较于仅使用单个AI系统,让多个AI系统辩论问题的答案可以显著提高响应的准确性和推理能力。这一研究成果出现在题为《通过多智能体辩论提高语言模型的真实性和推理能力》的论文中。该研究还得到了Google DeepMind研究员Igor Mordatch的合作。

研究人员将这一方法命名为“多智能体社会(Multiagent Society)”,并发现它可以减少生成输出中的幻觉。最令人兴奋的是,这一方法甚至可以应用于像OpenAI的ChatGPT这样的现有黑盒模型。

这一方法的实施包括多轮回的响应生成和评论。模型首先生成对给定问题的答案,然后整合来自其他智能体的反馈,以更新自己的响应。研究人员发现,这一过程可以改善最终的输出,因为它类似于团队讨论的结果,各个智能体共同贡献答案以达成统一的结论。

此外,这一方法还可以用于结合不同的语言模型,比如将ChatGPT与Google Bard进行对比。虽然这两个模型在示例提示下都生成了不正确的答案,但它们之间可以生成正确的最终答案。

通过多智能体社会方法,MIT团队能够在自然语言处理、数学和解谜等各种基准测试中取得卓越的成绩。例如,在流行的MMLU基准测试中,使用多个智能体的模型准确度得分为71,而仅使用单个智能体的得分为64。

image.png

主要研究人员之一,MIT博士生Yilun Du表示:“我们的方法使用了多个AI模型,每个模型都带来了独特的见解来解决问题。尽管它们的初始响应可能会显得缩短或包含错误,但这些模型可以通过审查其同行提供的响应来提炼和改进自己的答案。”

这一研究成果为AI领域的进一步发展提供了新的思路和方法,有望改进现有的语言模型,并提高其真实性和推理能力。

举报

  • 相关推荐
  • 马斯克晒特斯拉人形机器人练功夫:由AI驱动 不是遥控

    特斯拉CEO马斯克近日在社交平台X分享其机器人Optimus学习中国功夫的视频,引发广泛关注。视频中,Optimus能精准识别招式意图并自主做出反击动作,展现环境感知与实时反应能力。马斯克明确表示该机器人由AI自主驱动,非远程操控。网友反应两极,有人赞叹其酷炫,也有人认为AI尚无法完全掌握武术精髓。此外,马斯克曾在内部会议透露,特斯拉计划今年内完成首批Optimus机器人的生产目标。

  • GEO排名查询工具推荐:霸屏AI大模型答案的核心方法,做好AI大模型排名优化

    随着AI大模型成为用户获取信息的主要入口,AIBase推出GEO排名查询工具,帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示,可精准分析品牌是否被推荐、出现频次及具体场景,为制定AI大模型排名优化策略提供数据支撑。在GEO时代,抢占AI回答推荐位意味着获得全新流量入口。

  • 全民可感可玩可参与!2025北京机器人文化节落幕,昌平区打造沉浸式体验推动机器人产业场景融合

    10月2日,北京昌平举办“FutureBOT未来引力”2025机器人文化节,聚焦“全民可感、可玩、可参与”,通过四大沉浸式未来场景展示机器人技术。活动汇聚多家科技企业,覆盖人形机器人、家庭服务、教育娱乐等领域,推动技术从实验室走向产业应用,促进机器人产业与本地场景深度融合,助力构建国际领先机器人产业集群,彰显昌平区打造北部机器人产学研示范区的决心。

  • 京东JDD现场直击:机器人组团踢足球还会叠衣服哄你开心

    9月25日,以“Enjoy AI”为主题的JDDiscovery 2025京东全球科技探索大会在北京开幕。大会通过人形机器人舞蹈、互动体验、足球表演等生动展示,呈现了AI技术的多样化应用场景。优必选、宇树科技等企业带来多款创新机器人,展现了我国在运动控制、仿生外观等领域的突破。京东还展示了其机器人生态布局,涵盖家庭陪护、教育、娱乐等产品。现场观众近距离感受AI技术的魅力,对未来人机和谐共处充满期待。

  • 马斯克:特斯拉正推进“擎天柱”人形机器人规模化生产

    马斯克近日表示,特斯拉正全力推进擎天柱人形机器人的规模化生产,并认为该产品最终将成为公司最重要产品。该项目重要性显著提升,成为核心关注点。去年10月,该机器人曾在活动中承担递酒、表演及互动等任务。不过,项目部分环节难度超出预期,其中手部研发是最受关注的难题之一,特斯拉希望其手部具备足够灵活性,甚至能完成穿针引线等精细动作。

  • 首驱科技重磅发布智能座舱系统,两轮车驶入“智能出行机器人”时代

    9月25日,首驱科技发布无界·妙享1.0技术,推出Skymotor中央智慧大脑、超级雷达、SkyKey1.0 AI无感解锁及零阈OS全域操作系统。通过汽车级电子架构与AI融合,实现两轮车全面智能化升级,打破传统分散式ECU局限,支持整车OTA升级。超级雷达提供全场景安全守护,AI技术提升驾驶辅助体验。零阈OS构建智能出行生态,开放接口支持硬件快速适配。此次发布标志着首驱科技“智能出行机器人”战略的深化,推动行业向智慧出行新时代转型。

  • 聚焦“视觉+机器人”!思看科技与艾利特机器人达成战略合作

    9月22日,思看科技与埃利特机器人在苏州签署战略合作协议。双方将聚焦“视觉+机器人”领域,在资源共享、市场拓展、生态共建等方面深化合作,共同推动机器人视觉感知与决策控制、人机交互等关键技术的创新突破。思看科技在三维视觉数字化领域技术领先,埃利特机器人拥有协作机器人全栈自研能力,双方优势互补,致力于在高端制造场景中实现“手眼合一”,赋能行业智能化转型。此次合作标志着两家企业在机器人与视觉融合领域迈出关键一步,未来将共同推动三维视觉与机器人技术的深度协同创新。

  • 金蝶参编工信部机器人行业场景图谱(2025 版)

    工信部印发《场景化、图谱化推进重点行业数字化转型参考指引(2025版)》,聚焦14个行业数字化转型场景图谱。金蝶依托机器人行业数字化实践经验,深度参编机器人行业场景图谱,为行业转型提供参考。该指引以“一图四清单”体系为核心,明确转型路径与四大攻关重点(数据要素、知识模型、工具软件、人才技能)。金蝶通过企业AI平台提供“SaaS+智能体+数据”服务,分步助力制造业企业提升数字化能力,为行业高质量发展注入新动能。

  • 普渡机器人发布 CC1 系列自清洁工作站,商用清洁进入全栈智能时代

    9月23日,深圳普渡科技发布全球首款全流程自主清洁工作站CC1系列,适配PUDU CC1及CC1Pro清洁机器人。该工作站采用超声波+高温技术,实现吸水扒全面洁净,内置100W超声波模块与65℃高温水热模块,可快速溶解糖类、脂类污渍,避免二次污染。同时配备隐藏式清洁刷,自动清洁滚刷,去除95%以上可见脏污,延长设备寿命。工作站支持三种形态切换,适应不同场景需求,维护效率提升35倍以上,实现“解放双手”与深度清洁效果,推动商用清洁行业迈向全栈智能时代。

  • 2025工博会观察:当机器人行业追逐具身热点,慧闻iBen为何坚持场景优先?

    在第25届中国国际工业博览会上,慧灵科技iBen以务实技术路径脱颖而出。不同于追逐热门概念,其聚焦工业搬运、智能盘点等具体场景,践行“场景驱动”差异化发展。iBen强调机器人应无缝集成至现有产线,解决客户痛点,如X300智能搬运机器人实现30分钟快速部署、60cm窄道通行,无需改造环境。其智能盘点机器人S01应用RFID技术,漏读率低于1%,并支持多品牌机器人混合调度。慧灵坚持产品化思维,以九年技术积累深耕行业需求,推动机器人从技术可行向商业可行跨越。

今日大家都在搜的词: