首页 > AI头条  > 正文

大模型如何真正告别幻觉?元认知或是破局的关键

2026-06-03 08:52 · 来源: AIbase基地

大模型产生的“幻觉”——即一本正经地输出事实性错误,一直是困扰AI行业的核心痛点,尤其在医疗、法律等高风险领域,这一问题显得尤为致命。

长期以来,业界对抗幻觉的思路主要有二:一是不断扩大训练数据,试图让AI“全知全能”;二是设置防御机制,让AI在拿不准时选择“闭嘴”。然而,这两条路径都有明显的局限性。前者无法穷尽世间所有事实,总有盲区;后者则往往导致严重的“实用性税”:为了消除错误,AI不得不拒绝回答大量正确的问题,极大地牺牲了用户体验。

近期,谷歌研究院与特拉维夫大学联合发表的一篇论文,为这一困局提供了一个全新思路:元认知(Metacognition)。该研究提出,解决幻觉的核心不在于强求AI不犯错,而在于让AI学会“知之为知之,不知为不知”。

image.png

图:校准与判别力的区别。左图显示模型校准良好(红线贴近对角线),右图则揭示了残酷的现实——即便校准完美,要将错误率从25%压到5%,必须牺牲52%的正确回答。

论文重新定义了幻觉:问题的关键不在于AI输出的内容有误,而在于它在没有把握的情况下,依然以确定的口吻误导用户。研究者认为,AI应当具备“忠实不确定性”的能力。也就是说,当AI的内部计算状态表现出摇摆或低置信度时,其输出的措辞也应相应地表现出保留与谨慎,而非伪装成绝对事实。

所谓元认知,即AI对自己认知过程的认知。这要求大模型既能敏锐感知自身的内部状态,又能基于这种感知,诚实地表达确信程度。在AI代理(Agent)时代,这种能力尤为关键。一个缺乏元认知的AI系统,就好比一个没有仪表盘的飞行员,不仅无法判断何时该调用工具,也无法辨别搜索结果的真伪,极易引发工具滥用,甚至造成“盲飞”。

image.png

图:各主流模型在SimpleQA Verified上的实测表现。右上角五角星为理想目标,“Discrimination Gap”标注了现有模型与理想之间的鸿沟,“Utility Tax”则标示了Claude Opus4为换取高准确率而付出的实用性代价。

当然,实现这一路径也面临不小的挑战。例如,如何区分“真正的元认知”与“对不确定性的刻意表演”,以及如何避免RLHF(人类反馈强化学习)带来的负面效应——因为人类往往偏好语气笃定的回答,这在某种程度上反而诱导了AI学会伪装自信。

对于AI未来的发展,该研究给出了务实的建议:评价反幻觉技术的指标,不应再局限于单一的准确率,而应通过“实用性与错误率”的平衡曲线来评估。AI不需要成为一个从不犯错的幻象,但它必须具备专业人士最基本的素养:能够诚实地区分“我确定”与“我猜测”。这种对自身知识边界的清醒认知,才是提升AI可信度与实用价值的必由之路。

  • 相关推荐
  • 超节点提效30%!华为官宣昇腾亲和大模型:6月30日开源上线

    华为开发者大会(HDC 2026)上,华为常务董事、终端BG董事长余承东在大会主题演讲中宣布,推出昇腾亲和大模型,覆盖算法架构到训练推理全流程。 昇腾亲和大模型是业界首个DSA SWA独立分层混合架构。针对MoE(混合专家)模型专家路由问题进行了专项优化。 昇腾原生训练实现双重性能提升,训练效率提升30%,512K长序列训练吞吐提升50%

  • 大模型驱动算力需求扩容 寒武纪产品落地多行业

    大模型技术持续迭代推动智能计算需求高速增长,为上游智能芯片赛道带来广阔发展空间。寒武纪作为全球知名AI芯片公司,产品覆盖云、边、端智能芯片及板卡、智能整机、处理器IP和软件,满足不同规模AI计算需求。其云端智能芯片是数据中心核心器件,提供高算力、高效能硬件资源;智能整机与计算集群系统分别面向不同客户群体,产品已在运营商、金融、互联网等行业规模化部署。2025年,寒武纪云端产品线收入64.77亿元,同比大幅增长,将持续深耕核心赛道,提升市场占有率。

  • 建筑节能破局关键!itc保伦股份楼宇自控整体解决方案,数据赋能六大低碳节能建设目标落地

    我国建筑能耗占社会总能耗46.5%,商业写字楼、综合体和产业园区是能耗与碳排放“主力军”。传统人工运营模式存在长明灯浪费、空调负荷错配、能耗黑洞等问题。ITC保伦股份推出楼宇自控整体解决方案,通过软硬件一体化平台统筹空调、照明、给排水、电梯等系统,实现无人值守自主运行、能耗全维度精准管控,综合能耗降低15%-30%,照明能耗下降50%,并支持碳核算、智能运维和AI数据分析,已在多个项目成功应用。

  • 最强AI大模型Fable 5、Mythos 5发布:人类智力优势还能撑多久

    Anthropic发布基于Mythos Preview的Claude Fable 5和Mythos 5两款AI模型,自称最强,在多项测试中达SOTA水平。Fable 5面向公众开放,保留安全运制;Mythos 5无运制但仅限审核机构使用。两者性能卓越,尤其在编程方面提升明显,但存在定价昂贵(1M输入/输出分别需10/50美元)、安全运制敏感(触发即降级至Opus 4.8)及强制30天安全审计等问题,影响商业用户使用。

  • 8GB内存成硬伤!iPhone 17无缘苹果最强端侧AI大模型

    根据苹果官方硬件适配细则,iPhone 17标准版和满血版因仅配备8GB内存,无法达到12GB门槛,无缘端侧AI大模型。目前仅iPhone Air、iPhone 17 Pro及Pro Max三款机型可完整体验。博主透露,苹果后续可能调整策略,下一代iPhone 18系列或全系标配12GB内存,以从根源满足端侧大模型需求,避免基础款用户被核心功能割裂。12GB内存将大幅强化本地AI推理速度,支持更复杂多模态任务,并降低对云端的依赖,提升数据隐私保护。

  • 小米大模型推理速度全球最快!1000 tokens/s是啥概念:官方科普

    日前,小米正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。 据介绍,这是全球首个在通用GPU上突破1000 tokens/s的万亿参数模型,刷新了旗舰模型的全球最快推理速度。 今日,小米技术”公众号发文科普了什么是1000 tokens/s,以及这一速度到底有多快。 小米表示,token即词元,是大模型中的计量单位,类似日常买菜时使用的斤”两”。 1000 tokens/s也就是1000 Tokens Per Second,简称1000 TPS,意

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • 卓世科技入选“2026 AI科技小巨人TOP50”,以行业大模型与具身智能大脑构筑AI产业新底座

    近日,互联网周刊与德本咨询联合发布“2026AI科技小巨人TOP50”榜单,卓世科技(海南)凭借行业大模型研发、具身智能通用大脑搭建及全栈智能体执行引擎等硬核实力成功登榜。公司坚持“AI普惠”理念,打造“璇玑玉衡”千亿参数大模型体系,并首创Tri-Core三核协同具身智能通用大脑架构,破解行业痛点。同时推出NextClaw(龙虾)全栈执行引擎及OPC数字员工,实现从云端认知到物理世界执行的全链路打通,推动AI从“虚拟智能”向“物理AI”跨越。

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • 美团Tabbit AI浏览器正式版上线:核心功能永久免费!整合主流国内大模型

    美团正式发布Tabbit AI浏览器1.0标准版,结束100天公测,全面开放下载,支持安卓、鸿蒙、苹果系统。该产品打破传统浏览器局限,通过整合DeepSeek、Kimi等多款国内主流大模型,实现AI全流程自动化任务处理,如搜索、筛选、执行等。新增记忆功能提升交互连贯性,内置300余种实用技能,覆盖学习、办公、生活等场景,并启动“妙招大赛”鼓励用户分享原创技能。

今日大家都在搜的词: