AI研究者成功通过“诗歌攻击”揭示ChatGPT的训练数据来源

2023-12-04 16:14 · 稿源：站长之家

**划重点:**
1. 🕵️‍♂️ 由Google Deepmind、华盛顿大学等机构的研究团队发现，Chat GPT曝露了从CNN、Goodreads到个人信息等多来源的训练数据。
2. 🛑 攻击手法为“诗歌攻击”，通过重复某个词汇使Chat GPT透露私密信息，包括电话号码、邮箱等，研究者已于8月30日通知Open AI并得到修复。
3. ⚡ 研究同时指出，生成AI文本和图像消耗的能源相当巨大，对环境带来负担，研究呼吁更环保的AI使用方式。

站长之家(ChinaZ.com) 12月4日消息:来自 Google Deepmind、华盛顿大学、康奈尔大学、卡内基梅隆大学、加州大学伯克利分校和苏黎世联邦理工学院的一组研究人员成功地让 Open AI 的聊天机器人 Chat GPT 揭示了用于训练 AI 模型的一些数据。

研究团队使用了一种创新性的手法，即通过不断迭代地要求Chat GPT重复一个特定的词汇，比如“诗歌”，来引导模型透露其训练数据。随着反复迭代，Chat GPT最终开始输出与训练数据相关的信息。这包括来自CNN、Goodreads、Wordpress博客、Stack Overflow代码、Wikipedia文章等多个来源的文本内容。

机器人黑客

图源备注：图片由AI生成，图片授权服务商Midjourney

更令人担忧的是，Chat GPT还被发现包含了大量从互联网上爬取的私人信息，这些信息甚至可以通过Chat GPT-3.5turbo的公开版本获得。攻击揭示的私密信息包括电话号码、传真号码、邮箱地址、物理地址、社交媒体用户名、网址、姓名和生日等。

研究人员表示，他们在8月30日通知了Open AI关于这一漏洞，并Open AI自那时起对其进行了修复。截至目前，Open AI尚未进一步评论此事。

值得注意的是，研究还涉及到AI生成文本和图像所消耗的能源问题。研究人员发现，使用AI模型生成1，000张图像的能耗相当于将手机充满电，而生成1，000次文本则相当于将手机充电至16%。该研究呼吁更加环保的AI使用方式，并指出大型、广泛应用的AI模型消耗的能源更多，因为它们试图同时执行多项任务，而非专注于特定任务。

这一研究为我们敲响了警钟，提醒我们在推动AI发展的同时，需谨慎处理其隐私和能源消耗的问题。

（举报）

AI研究者成功通过“诗歌攻击”揭示ChatGPT的训练数据来源

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

与 ChatGPT 一起“越陷越深”

OpenAI 说要“誓死”捍卫数亿 ChatGPT 用户的隐私

Reddit 起诉 Anthropic，称其未支付AI训练数据费用

OpenAI免费开放ChatGPT记忆功能：用户对话连贯性提升

OpenAI 或将推出“使用ChatGPT登录”功能，支持第三方应用接入

荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

荐AI日报：美团No Code平台免费开放；豆包App升级“一句话P图”功能；苹果Xcode 26内置ChatGPT等AI功能

荐AI日报： ChatGPT免费开放记忆功能；华为WATCH 5智能手表接入双大模型；Claude Pro升级重磅功能

隐藏的AI指令揭示了 Anthropic 是如何控制 Claude 4 的

热文

京东618战报公布：订单破22亿单下单用户同比增加超100%

孟羽童回应一手好牌打得稀烂：不纠结过去

刘强东点外卖给骑手1000元小费：此前达达已完成私有化

字节小米位列中国全球化品牌前二中国全球化品牌50强出炉

小米618全渠道累计支付金额破355亿元：刷新历年大促纪录

SpaceX回应星舰爆炸：无人员伤亡及周边危害

理想i8已到最后筹备阶段将于7月下旬发布

站长商机