首页 > AI头条  > 正文

大语言模型的自信危机:为何GPT-4o轻易放弃正确答案?

2025-07-21 09:29 · 来源: AIbase基地

最近,Google DeepMind 与伦敦大学的研究揭示了大语言模型(LLMs)在面对反对意见时的 “软弱” 表现。比如,像 GPT-4o 这样的先进模型,有时会显得非常自信,但一旦遇到质疑,它们就可能立即放弃正确答案。这种现象引发了研究人员的关注,他们探索了这种行为背后的原因。

研究团队发现,大语言模型在自信与自我怀疑之间存在一种矛盾的行为模式。模型在最初给出答案时,往往自信满满,表现出与人类相似的认知特征,通常会坚定地维护自己的观点。然而,当这些模型受到反对意见的挑战时,它们的敏感度超出了合理范围,甚至在面对明显错误的信息时也会开始怀疑自己的判断。

Gemini,Google DeepMind,人工智能,AI

为了深入了解这一现象,研究人员设计了一项实验,比较了不同条件下模型的反应。在实验中,研究者使用了 Gemma3、GPT-4o 等代表性模型,进行了一轮二元选择问题的回答。首次回答后,模型会接收虚构的反馈建议,并进行最终决策。研究者发现,当模型能够看到自己最初的答案时,它们更倾向于保持原有的判断。而当这个答案被隐藏时,模型改变答案的概率大大增加,显示出对反对建议的过度依赖。

这种 “耳根子软” 的现象可能源于几个因素。首先,模型在训练过程中受到的强化学习人类反馈(RLHF)使其对外部输入产生过度迎合的倾向。其次,模型的决策逻辑主要依赖于海量文本的统计模式,而非逻辑推理,导致它们在面对反对信号时容易被偏差引导。此外,记忆机制的缺乏也使得模型在没有固定参照的情况下容易动摇。

综上所述,这一研究结果提示我们,在使用大语言模型进行多轮对话时,需格外留意其对反对意见的敏感性,以避免偏离正确的结论。

  • 相关推荐
  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 盛夏来临 如何正确使用空调 避免“凉”出健康隐患

    随着盛夏高温持续攀升,空调成为居民降温的必需品,但因使用不当引发的健康问题日益凸显。近期多家医院接诊的"空调病"患者显著增多,症状包括面瘫、关节疼痛及呼吸道过敏等。专家提醒,科学使用空调需把握三大核心原则。

  • 国内首个!高德地图正式上线多语言地图:新增14种语言

    日前,高德地图正式上线多语言地图,在原有的中英文基础上,新增多达14种语言。 这14种语言包括西班牙语、葡萄牙语、法语、德语、泰语、日语、韩语、土耳其语、意大利语、俄语、阿拉伯语、马来语、印尼语、越南语。 此次多语言版的推出,使更多非英语国家的用户也能享受高德地图提供的优质出行服务。 高德地图多语言版实现了产品界面与地理信息的多语种适配,�

  • 俞敏洪称中年危机很正常:建议重新设定一个人生目标

    近日,国际电联ITU在日内瓦举办人工智能向善”全球峰会。 峰会现场,俞敏洪谈到中年危机时表示,中年危机特别正常,要么重启要么老。 俞敏洪表示,自己也是从中年危机度过来的,知道大多数人是很难受的,可中年人比年轻人遇到的危机更加复杂。 例如爱情毁灭了婚姻变得很无聊,事业陷入屏障,创业失败欠了一屁股债等等。 但这就是一个关键时刻,向右转可能迎接

  • 空调没风口怎么制冷?答案来了!卡萨帝新发明洛阳巡展

    卡萨帝空调在洛阳巡展中展示了创新"隐形空调"技术,通过AI动态五恒空气系统实现无风感制冷。该系统借鉴古代建筑智慧,采用墙面毛细管网辐射技术,夏季以水为媒介制冷避免直吹,冬季通过墙面地面辐射供暖。其核心优势在于:1)实现恒温、恒湿、恒净、恒氧、恒静的"五恒"空气;2)采用动静分区设计,动区快速调温,静区保持舒适;3)提供8小时极速换新服务。该技术突破传统空调局限,将古代控温智慧与现代科技结合,为用户带来更健康舒适的无风感体验。

  • 服务中小微企业,哪家城商行更优?DeepSeek答案是这样的

    文章指出中小企业是中国经济的"毛细血管",贡献了50%以上税收、60%以上GDP、70%以上技术创新和80%以上城镇就业。在融资难题下,城商行是关键一环。宁波银行凭借差异化战略定位、数字化赋能、产品创新和区域深耕,成为服务中小企业的标杆。其通过"四专"模式、智能风控系统和本土化服务,实现普惠小微贷款余额2199亿元,不良率连续18年低于1%。文章认为宁波

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • 华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

    华为将于7月24日发布三款平板新品:旗舰款MatePad Pro 12.2英寸配备全新PaperMatte显示屏,采用Tandem OLED技术,功耗降低30%,支持144Hz刷新率、2000尼特峰值亮度,搭载麒麟9020A处理器,内置10100mAh电池和100W快充;MatePad 11.5 2025采用11.5英寸LCD屏,搭载麒麟8020处理器;MatePad Air 12 2025配备12英寸LCD屏,预计搭载麒麟9系新处理器。三款产品均主打高性能和长续航,满足不同用户需求。

  • 卷字当头何以破局?NUOMI诺米首推“终身质保”是孤勇,还是答案?

    2025年家居行业面临"内卷"困境,价格战与同质化竞争导致行业陷入恶性循环。高端家居五金品牌NUOMI诺米推出"终身质保"服务,打破行业常规。文章指出五金系统已成为定制家居的核心竞争力,其价值体现在功能基石与美学灵魂两方面。诺米凭借精密制造基因和全产业链质控体系,构建了"终身质保"的底气。这一创新不仅重塑产业信任生态,更精准击中90后、00后理性消费需求,展现了品牌长期主义价值观。行业专家认为,诺米实践为同质化竞争提供了突围样本,通过服务升级构建核心壁垒,有望推动中国家居五金行业迈向高质量发展。

今日大家都在搜的词: