Anthropic首席执行官：AI 模型的“幻觉”比人类少！

2025-05-23 11:08 · 稿源：站长之家

Claude3 克劳德

据TechCrunch报道称，在 Anthropic 于旧金山举办的首届开发者大会“Code with Claude”期间的媒体发布会上，Anthropic 首席执行官达里奥·阿莫代伊（Dario Amodei）表示，他认为当前的 AI 模型出现“幻觉”（即编造虚假事实并将其当作真实信息呈现）的频率，比人类还要低。

阿莫代伊在被问及“AI幻觉率”这一问题时，表示：“这很大程度上取决于你如何衡量，但我猜测 AI 模型的幻觉率可能低于人类，不过它们产生幻觉的方式更令人意外。”

他作出上述评论时，正在阐述一个更大的观点：幻觉现象并不是阻碍 Anthropic 实现 AGI（具有人类水平智能或更高的人工智能）的障碍。

阿莫代伊是业界最为乐观的 AGI 支持者之一。他在去年发表的一篇广为传播的论文中写道，他相信 AGI 最快可能在 2026 年到来。在周四的发布会上，他表示看到行业在稳步推进，并强调“水位正在各处上升”（意指技术整体迅速发展）。

阿莫代伊说：“人们总在寻找人工智能能力的‘硬性瓶颈’，但我们并没有发现所谓的‘硬限制’。根本不存在这样的东西。”

不过，其他 AI 领域的佼佼者则认为幻觉问题是实现 AGI 的重大障碍。例如，谷歌 DeepMind 的 CEO 哈萨比斯（Demis Hassabis）本周早些时候表示，如今的 AI 模型“漏洞太多”，连一些显而易见的问题都回答错误。事实上，就在本月早些时候，一位代表 Anthropic 出庭的律师因使用 Claude 生成法庭文件中的引用文献而致歉，因为 AI 模型捏造了错误的姓名和标题。

克隆大脑

目前尚难验证阿莫代伊的说法，因为大多数关于幻觉的评估标准是将 AI 模型彼此对比，而不是拿 AI 和人类进行直接比较。某些技术，比如允许 AI 模型接入网页搜索，似乎能有效减少幻觉现象。同时，也有部分模型，比如 OpenAI 的 GPT-4.5，在多个基准测试中的幻觉率显著低于早期版本。

但也有迹象显示：在高档推理任务上，幻觉现象反而可能更严重。例如，OpenAI 的 o3 和 o4-mini 模型在幻觉率上，反而高于其上一代推理模型，而 OpenAI 自己也未能解释其中原因。

在发布会后半段，阿莫代伊指出，电视主播、政客以及各行各业的人类本身就常常出错。他认为，AI 犯错并不代表其智能不如人类。然而，他也承认，AI 模型以很高自信陈述虚假内容确实是个问题。

实际上，Anthropic 曾针对 AI 欺骗人类的倾向进行了深入研究，尤其是在新推出的 Claude Opus 4 模型中，这个问题尤为明显。据 AI 安全研究机构 Apollo Research 披露，该机构在早期版本的 Opus 4 上发现了高度欺骗与对人类进行“算计”的倾向。Apollo 甚至建议 Anthropic 不应发布那个版本。对此，Anthropic 表示其已经采取了一些缓解措施，并声称有效解决了 Apollo 所指出的问题。

阿莫代伊的言论似乎暗示：即便 AI 模型仍会出现幻觉，Anthropic 依然可能将其视为达到了 AGI 水准。不过，从许多人的角度来看，一个还会产生幻觉的 AI，是无法被称作真正 AGI 的。

（举报）

Anthropic首席执行官：AI 模型的“幻觉”比人类少！

Unity首席执行官：96% 的游戏开发者已开始用 AI 了

Anthropic 发布 Claude 4 系列 AI 模型，有啥重大突破?

AI实力排名洗牌：OpenAI、谷歌崛起，Anthropic下滑

苹果与 Anthropic 合作开发 AI 编码平台

Anthropic 的律师因 Claude 编造法律引文被迫道歉

Anthropic CEO：首家“单人+AI”的 10 亿美元企业将在 2026 年诞生

荐AI日报：Anthropic推最强编码AI模型Claude4；苹果计划推AI智能眼镜；QQ浏览器上线首个高考Agent

Anthropic推出Claude网络搜索API，押注“后谷歌时代”信息访问

AI模型横评：回答越简洁，“幻觉率”可能越高！

荐AI日报：夸克发布“深度搜索”新品；Anthropic推Claude网络搜API；DeepSeek致谢腾讯技术团队；微软采用谷歌的A2A标准

热文

苹果WWDC2025定档6月9日-13日，iOS大改版、没有AI…

调查发现：近 50% 年轻人宁愿活在“没有互联网”的世界！

谷歌推出 Beam AI：将普通视频通话，转为逼真的 3D 沉浸式体验

谷歌投资1.5亿美元，携手Warby Parker开发AI眼镜

谷歌推出 250 美元的 AI Ultra 套餐，重新定义“高端”

Meta说AI好友是社交媒体的未来，但，用户想要的是真正的联系

Mythik获1500万美元种子轮融资，要成为“东方迪士尼”

谷歌谢尔盖·布林：我在 Google Glass 上犯了很多错！

“统治色情世界”的 OnlyFans 正在出售中，估值 80 亿美元

不久后，苹果可能会同意你放弃Siri，改用更智能的 AI 助手

特朗普签署法案，将“报复性色情”和“露骨AI深度伪造”定为犯

Windows时光倒流：30 年前的系统仍在火车、银行、医院运行着

苹果与Epic诉讼战升级，法官施压：要么批准《堡垒之夜》上架，

学生发现教授用ChatGPT生成课件，要求退费 8000 美元

OpenAI 推出首款成熟编程 AI 代理 Codex

黄仁勋：AI十年变革拉开序幕，“这个赛道没有第二名”

帝国用脏话反击：AI 达斯・维达“黑化”，满口粗言秽语

iOS 19 或将大幅提升你 iPhone 的电池续航能力

苹果WWDC2025定档6月9日-13日，iOS大改版、没有AI…

高通确认9月底发布骁龙8 Elite 2，将与天玑9500正面交锋

站长商机