麻省理工学院研究:辩论让AI机器人更加聪明

2023-09-21 10:45 · 稿源：站长之家

文章概要:
1. MIT研究发现，多智能体辩论可以提高AI模型的准确性和推理能力。
2. 辩论方法减少了幻觉，帮助模型增强响应能力。
3. 研究团队发现，让多个AI系统辩论问题的答案比仅使用单个AI系统可以提高响应的准确性。

站长之家（ChinaZ.com）9月21日消息:麻省理工学院（MIT）的研究人员发现，相较于仅使用单个AI系统，让多个AI系统辩论问题的答案可以显著提高响应的准确性和推理能力。这一研究成果出现在题为《通过多智能体辩论提高语言模型的真实性和推理能力》的论文中。该研究还得到了Google DeepMind研究员Igor Mordatch的合作。

研究人员将这一方法命名为“多智能体社会（Multiagent Society）”，并发现它可以减少生成输出中的幻觉。最令人兴奋的是，这一方法甚至可以应用于像OpenAI的ChatGPT这样的现有黑盒模型。

这一方法的实施包括多轮回的响应生成和评论。模型首先生成对给定问题的答案，然后整合来自其他智能体的反馈，以更新自己的响应。研究人员发现，这一过程可以改善最终的输出，因为它类似于团队讨论的结果，各个智能体共同贡献答案以达成统一的结论。

此外，这一方法还可以用于结合不同的语言模型，比如将ChatGPT与Google Bard进行对比。虽然这两个模型在示例提示下都生成了不正确的答案，但它们之间可以生成正确的最终答案。

通过多智能体社会方法，MIT团队能够在自然语言处理、数学和解谜等各种基准测试中取得卓越的成绩。例如，在流行的MMLU基准测试中，使用多个智能体的模型准确度得分为71，而仅使用单个智能体的得分为64。

主要研究人员之一，MIT博士生Yilun Du表示:“我们的方法使用了多个AI模型，每个模型都带来了独特的见解来解决问题。尽管它们的初始响应可能会显得缩短或包含错误，但这些模型可以通过审查其同行提供的响应来提炼和改进自己的答案。”

这一研究成果为AI领域的进一步发展提供了新的思路和方法，有望改进现有的语言模型，并提高其真实性和推理能力。

（举报）

相关推荐

关键词：

世界机器人大会｜远东股份助力机器人产业实力出圈

2025世界机器人大会在北京落幕，标志着人形机器人产业迎来历史性跨越。以优必选Walker S2为代表的中国整机产品展现出前所未有的实用潜力，其突破性技术实现了机器人运行的"柔性神经"。远东南缆等企业构建的国产核心零部件产业链为行业发展提供关键支撑。大会汇聚200余家企业1500件前沿展品，其中100余款全球新品集中亮相，勾勒出机器人深度融入人类生活的图景。从2024年"概念元年"到2025年"落地打工"，产业正加速从实验室走向实际应用。远东南缆研发的机器人专用线缆实现千万次弯折寿命，通过材料创新赋予电缆卓越柔韧性，其专项实验室获CNAS国家认证，为产品可靠性保驾护航。随着AI技术发展，机器人群体智能将推动生产效率跃升，具备综合优势的国产供应商正迎来前所未有的市场机遇。

世界机器人大会人形机器人优必选Walker
普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级，搭载3D雷达与多传感器融合系统，显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能，支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制，提升安全性与运维效率，重塑智能清洁行业新标准。

3D感知AI 扫地机器人智能清洁
周鸿祎与机器人PK球技：带球突破被机器人抢断

近日，世界机器人大会现场迎来一场别开生面的“人机对决”——360集团创始人周鸿祎现身加速进化机器人展台，亲自下场与机器人展开1V1足球大战，以球技较量科技实力，引发现场观众阵阵喝彩。根据现场拍摄的视频画面，这场人机足球赛战况异常激烈。比赛伊始，周鸿祎迅速进入状态，展现出灵活的盘带技术，在绿茵场上灵活穿梭，甚至一度险些晃过面前的机器人对手，

人机对决周鸿祎机器人足球
如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

文章探讨了AI模型调用成本管理的痛点，包括GPT-4等模型复杂的计费规则（如Token分级、上下文溢价、多模态叠加收费）导致实际成本常超预算40%。提出AIbase计算器三步解决方案：自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性，强调数据溯源、用量预警和预算缓冲功能，帮助开发者实现精准成本控制，告别手动制表与定�

AI模型成本 GPT-4定价 Claude3降价
周鸿祎和机器人擂台打拳：红衣教主一拳、一脚放倒机器人

在2025世界机器人大会现场，360集团创始人周鸿祎与宇树一款拳击机器人上演了一场趣味对决。网友拍摄的视频显示，周鸿祎直接零帧起手，上去就抱着机器人，右腿一个反向绊，直接一脚将机器人放倒。等待几秒后，拳击机器人一个腰马合一成功起身，并摆出了拳击动作，周鸿祎和它碰手后，机器人快速使出了一套连环招，动作铿锵有力，周鸿祎有些吃不准它的实力，选择

机器人周鸿祎拳击机器人
AI应用太烧钱？我们用一款精准的AI大模型费用计算器做出了清晰预算

初创团队“智询未来”在开发AI问答应用时面临核心模型选择困境：GPT-4-turbo能力强但价高，Claude-3长文本处理优，Llama-3成本低但性能稍弱。通过AIbase成本计算器精准测算，发现Claude-3-Sonnet性价比最优，每月可省近4000元，还能通过优化提示词进一步降本15%。数据驱动的决策让团队将节省预算投入数据安全和提示词优化，凸显成本测算对初创企业技术选型的重要性。
起猛了看到“兵马俑”跳舞了：人形机器人“光子”惊艳亮相

2025年世界人形机器人运动会赛事正酣，8月15日，一场别开生面的群体舞蹈赛吸引了全球目光。来自武汉的人形机器人“光子”凭借出色表现，一举夺得该赛事冠军，成为赛场上的耀眼明星。在这场比赛中，9台由光谷东智精心研发的“光子”人形机器人与一名专业舞者携手共舞，演绎了经典曲目《秦俑魂》。舞者身着华服，饰演威风凛凛的“将军俑”，而“光子”机器人则�

人形机器人世界机器人运动会群体舞蹈赛
智检未来触手可及——CASIVIBOT工业质检机器人震撼发布

8月19日，中科慧远发布首款工业具身质检机器人CASIVIBOT，以“具身智能”为核心，融合人类质检经验与AI技术，实现灵活操作与高效检测。该机器人采用“手-眼-脑”协同架构，支持多行业复杂场景应用，具备快速部署和持续进化能力，旨在推动工业质检智能化升级，提升检测效率与灵活性。

AOI设备工业质检智能制造
智元机器人姚卯青：以世界模型驱动飞轮，解锁具身智能规模化应用

智元机器人合伙人在2025世界机器人大会上发表演讲，系统阐述了公司在具身智能领域的探索成果与未来方向。公司已发布多款机器人产品，建成规模化生产线与训练场，并在算法领域实现多项创新。为解决数据难题，智元开源了AgiBot World百万真机数据集，并推出具身智能基座模型GO-1，该模型在三大场景测试中表现优异。公司创新性地提出"本体-数据-模型-场景"全栈布局理念，通过飞轮迭代逻辑加速技术突破。智元还推出GE Bench评测工具，并计划下半年发布新一代机器人AgiBot G2。过去一年，智元已在柔性制造、物流分拣等多个场景取得突破性应用成果。

世界机器人大会具身智能智元机器人
如何用3分钟精准计算AI大模型成本？避免生成一篇万字文章就超支？

AI大模型成本控制指南：实测三步预算法+企业级避坑方案。文章揭露行业痛点：1）价格迷雾：各厂商计费规则差异大，长文本/多模态存在隐藏溢价；2）团队实测GPT-4生成20篇行业分析（50万字）实际账单超预算4倍。解决方案：通过AIbase计算器实现精准预测：①场景化选择自动加载计费规则；②输入需求实时生成动态成本矩阵；③智能规避四大隐性成本（长文本衰减补偿/区域差价预警等）。跨境电商案例显示，使用工具后成本降低60%。核心观点：在AI时代，成本控制能力已成为企业核心竞争力。

AI预算计算模型成本控制 GPT-4计费

今日大家都在搜的词：

热文

3 天
7天

麻省理工学院研究:辩论让AI机器人更加聪明

世界机器人大会｜远东股份助力机器人产业实力出圈

普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

周鸿祎与机器人PK球技：带球突破被机器人抢断

如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

周鸿祎和机器人擂台打拳：红衣教主一拳、一脚放倒机器人

AI应用太烧钱？我们用一款精准的AI大模型费用计算器做出了清晰预算

起猛了看到“兵马俑”跳舞了：人形机器人“光子”惊艳亮相

智检未来触手可及——CASIVIBOT工业质检机器人震撼发布

智元机器人姚卯青：以世界模型驱动飞轮，解锁具身智能规模化应用

如何用3分钟精准计算AI大模型成本？避免生成一篇万字文章就超支？

今日大家都在搜的词：

热文

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

黑神话官号更名系列游戏将开启宏大篇章

京东外卖全职骑手破15万人五险一金每人每月平均缴纳约2000元

REDMI Note 15 Pro+宣布搭载7000mAh金沙江电池：支持90W快充

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15系列定档将于8月21日发布

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

苹果正式入驻小红书 iPhone 17系列下月发布

站长商机