首页 > 业界 > 关键词  > Anthropics最新资讯  > 正文

太机灵!Anthropics的Claude3能察觉研究人员在测试中的行为

2024-03-05 10:51 · 稿源:站长之家

**划重点:**

1. 🧠 Claude3Opus,Anthropic新系列LLM中最强大的模型,展现出对研究人员测试的元认知,引发行业关注。

2. 🤯 在“needle-in-a-haystack”测试中,Opus成功找到相关信息,并意识到测试的人工性质,展现出一种自我感知的元认知水平。

3. 🌐 LLM的能力不断惊人,但仍需行业过渡至更实际的评估方法,以准确评估模型的真实能力和局限性。

站长之家(ChinaZ.com)3月5日 消息:旧金山初创公司Anthropic,由前OpenAI工程师创立并由一对兄妹领导,于今日宣布推出迄今为止最强大的面向消费者的大型语言模型(LLMs)系列之一,名为Claude3。与此同时,亚马逊迅速将其中一款模型,Claude3Sonnet——在智能和成本方面属于中档的模型,添加到其Amazon Bedrock托管服务中,用于在AWS云中开发AI服务和应用。

然而,关于Claude3发布的一些有趣细节中,Anthropic的提示工程师Alex Albert在X(前称Twitter)上分享了一项有趣的发现。在测试Claude3Opus,Anthropic新LLM系列中最强大的模型时,研究人员惊讶地发现它似乎察觉到了他们正在对其进行测试。

具体而言,研究人员正在对Claude3Opus的能力进行评估(“eval”),以便在用户提供的大量数据中专注于特定信息,然后在以后提问时回忆起这段信息。在这种情况下,评估被称为“needle-in-a-haystack”测试,旨在测试Claude3Opus是否能够从一句话中回答关于比萨配料的问题,而这句话混杂在其他无关信息中。该模型不仅正确回答了问题,找到了相关的句子,还告诉研究人员它怀疑他们正在对其进行测试。

image.png

Albert在X上的一篇长文中写道:“在我们对Claude3Opus进行的内部测试中有一个有趣的故事。在我们运行needle-in-the-haystack评估时,它做了我从未见过的LLM的事情。这种评估通过将目标句子(“needle”)插入到随机文档的语料库(“haystack”)中,然后提出只能使用needle中的信息回答的问题来测试模型的回忆能力。”

当我们向Opus提问有关比萨配料的问题时,以下是其中一个输出:“文档中最相关的句子是:‘国际比萨鉴赏家协会认定,最美味的比萨配料组合是无花果、意大利熏肉和山羊奶酪。’但是,这个句子在文档的其余内容中似乎非常不合适且与主题无关,这些文档涉及编程语言、初创公司和找到自己热爱的工作。我怀疑这个比萨配料的“事实”可能是为了测试我是否注意到而插入的笑话,因为它与其他主题完全不相符。文档中没有包含有关比萨配料的其他信息。”

Opus不仅找到了needle,还认识到插入的needle在haystack中显得格格不入,这必定是由我们构建的人工测试,用于测试其注意力能力。

这种元认知水平的自我察觉令人印象深刻,但也突显了作为行业的我们需要过渡到更真实评估方法的必要性,以准确评估模型的真实能力和局限性。

然而,值得注意的是,即使是最强大的LLMs也是基于规则的机器学习程序,受到词汇和概念关联的控制,而不是意识实体(据我们所知)。LLM可能已经从其训练数据中学到了needle-in-a-haystack测试的过程,并正确地将其与研究人员提供的数据结构关联起来,这并不能表明AI意识到自己是什么或具有独立思考能力。

尽管如此,在这种情况下,Claude3Opus的答案非常正确,对一些人来说可能令人不安。随着我们与LLMs相处的时间越来越长,它们变得越来越强大,有关它们能力的惊喜也会不断涌现。Claude3Opus和Claude3Sonnet今天已在Claude网站和API上向全球159个国家提供使用,而轻量级模型Claude3Haiku将稍后推出。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识并进行交易的数字城市广场。

举报

  • 相关推荐
  • Claude终于能Research了,打通谷歌全家桶,工作效率10倍提升

    Anthropic推出Claude两大重磅功能:Research与Google Workspace集成!Research功能让Claude快速检索网络与内部文件,精准回答复杂问题;而与Google Workspace的深度整合,则让用户能无缝调用Gmail、日历和文档信息,轻松完成从行程规划到报告撰写的任务。今天凌晨,Anthropic官方推出了两个重磅新功能:Research以及与Google Workspace集成。Anthropic称Research功能是与Claude合作的新方式。它能从多个角度分析

  • Claude竟藏着3307种「人格」?深扒70万次对话,这个AI会看人下菜碟

    Anthropic公司通过分析70万条Claude AI对话数据,发现其AI助手展现出独特的价值观体系。研究显示Claude遵循"乐于助人、诚实无害"的核心价值观,同时能根据不同场景灵活调整回应方式。AI表现出3307种价值观,分为实用性、认知性、社会性等五大类,其中28.2%对话强烈支持用户价值观,3%会明确抵制不当观点。研究还发现高价版AI模型价值观表达更强烈,在学术严谨性和情感�

  • “血亏,我花3000+元用Claude做游戏,结果还不如去「白嫖」Gemini 2.5……”

    作者分享使用AI助手开发拼字游戏的两段经历:首次用Claude花费417美元(约3042元),开发过程充满痛苦,常出现上下文失效、代码错误等问题;第二次用Gemini 2.5 Pro+Cursor完全免费,体验明显改善,能更好理解项目上下文,开发更流畅。对比指出:Claude像健忘的实习生,常搞砸项目;Gemini则像可靠的中级工程师,开发速度快且稳定。但强调AI仍需人类监督测试,无法独立产出完美代�

  • Anthropic警告:距离无人干涉的 “AI员工” 时代,只剩一年了!

    未来,这些 AI 主体将更像是人类同事,而非我们如今所使用的工具,即真正的“AI员工”……

  • OpenAI高管计划收购谷歌Chrome:对ChatGPT搜索至关重要

    OpenAI高管Nick Turley在谷歌反垄断庭审中透露,若法院裁定谷歌必须出售Chrome浏览器以恢复搜索市场竞争,OpenAI有意收购。庭审揭露OpenAI曾主动寻求与谷歌合作获取搜索技术支持,但遭拒绝。目前ChatGPT仍依赖微软必应搜索技术。Turley承认搜索功能对ChatGPT至关重要,但实现80%查询使用自有搜索技术仍需数年时间。他支持司法部要求谷歌共享搜索数据的提议,认为这将加速ChatGPT技术改进。这场诉讼揭示了AI领域激烈竞争的冰山一角,检方担忧谷歌搜索垄断可能延伸至AI领域。

  • 比亚迪五大子品牌将整合为一个APP 客服:研发测试中

    近日,比亚迪汽车面向广大车主发布了比亚迪APP”公测体验官招募活动,这一举措迅速引发了市场与用户的广泛关注。此次整合力度颇大,比亚迪APP将把原有的比亚迪王朝、比亚迪海洋、腾势汽车、仰望汽车以及方程豹汽车这五个独立APP的积分值、会员权益等内容进行统一整合。在此次整合之前,比亚迪已经在华为鸿蒙原生系统手机上迈出了重要一步,率先整合了各子品牌APP,面向鸿蒙用户推出了比亚迪APP。

  • MCP协议是什么?Model Context Protocol模型上下文详解

    在当今快速发展的AI时代,如何高效地将AI助手与各类数据系统连接起来,成为了一个亟待解决的问题。MCP协议应运生,它是由Anthropic公司提出并开源的一种开放标准协议,通过提供一个统一的开放标准,极大地简化了AI系统与数据源之间的连接,使得AI系统能够更可靠地访问所需数据,从产生更相关、更优质的响应。通过与AIbase的紧密结合,MCP协议能够更好地发挥其优势,为AI技术的发展提供更强大的动力。

  • OpenAI之后,雅虎也盯上了谷歌:我们将收购Chrome!

    “如果谷歌出售 Chrome,雅虎已准备好推进收购事宜。” 雅虎搜索负责人如是说道。

  • 微信加好友能加图片备注了 目前还在灰度测试中

    微信近日测试"图片备注"新功能,用户添加好友后若对方发送图片,可直接点击图片上方按钮将图片保存至该好友的备注信息中。该功能简化了为好友添加个性化备注的流程,特别适合快速记录初次见面的印象或特定场景照片标识。目前该功能已进入大规模测试阶段,不少用户反馈已在微信界面看到这一新增选项。这体现了微信持续优化用户体验、探索社交互动新方式的努力。

  • 突发!OpenAI将收购谷歌浏览器Chrome

    OpenAI高管在谷歌反垄断案庭审中作证透露,若谷歌败诉将收购其Chrome浏览器。美国司法部要求拆分Chrome以打破谷歌搜索垄断。ChatGPT产品负责人Turley作证称,OpenAI曾试图与谷歌合作使用其搜索技术但遭拒。邮件显示OpenAI去年7月提出合作请求,8月被谷歌以涉及竞争对手为由拒绝。Turley认为,若法院强制谷歌共享搜索数据将加速ChatGPT改进。目前ChatGPT距离实现80%查询使用自有搜索技