首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI 因使用「窃取」的个人数据训练 ChatGPT 而被集体诉讼

2023-06-30 08:31 · 稿源:站长之家

站长之家(ChinaZ.com) 6月30日消息:加利福尼亚一家律师事务所对 OpenAI 提起了一项集体诉讼,指控其「窃取」个人数据用于训练 ChatGPT

OpenAI,ChatGPT,人工智能,AI

Clarkson 律师事务所在周三向加利福尼亚北区法院提起诉讼,声称 ChatGPT 和 Dall-E「使用窃取的私人信息,包括可识别个人身份的信息,来自数亿互联网用户,包括各个年龄段的儿童,而这些用户并未给予知情同意。」

为了训练其庞大的语言模型,OpenAI 从互联网上抓取了 3000 亿个词,其中包括社交媒体网站如 Twitter 和 Reddit 上的个人信息和帖子。该律师事务所声称 OpenAI「秘密进行这样的操作,而且未按照适用法律的规定注册为数据经纪人。」

OpenAI 因其收集和使用数据的方式而引起争议。直到最近,用户没有明确的方式可以选择不让 OpenAI 使用他们的对话和个人信息来训练模型。ChatGPT 最初在意大利根据欧洲通用数据保护条例 (GDPR) 被禁止,原因是用户数据保护不充分,尤其是涉及未成年人的数据。

此次诉讼涉及 OpenAI 针对现有用户的不透明隐私政策,但主要关注从互联网上抓取的数据,这些数据本来从未明确意图与 ChatGPT 共享。通过微软的数十亿美元投资和 ChatGPT Plus 的订阅收入,OpenAI 从这些数据中获利,却没有对数据来源进行补偿。

诉讼中的 15 项指控包括侵犯隐私、疏忽未能保护个人数据和非法获取大量个人数据用于训练模型。像 Common Crawl、维基百科和 Reddit 这样的数据集包含个人信息,只要公司遵循购买和使用这些数据的协议,它们就是公开可用的。

但 OpenAI 据称在未经用户许可或同意的情况下在 ChatGPT 中使用了这些数据。尽管人们的个人信息在社交媒体网站、博客和文章上是公开的,但如果数据在预期平台之外使用,则可能被视为侵犯隐私。

在欧洲,公共领域和免费使用数据之间有法律区别,这得益于《通用数据保护条例》(GDPR),但在美国,这仍然在争议之中。Gartner 隐私研究副总裁 Nader Henein 认为,诉讼所表达的观点是有效的,他说:「人们应该对他们的数据如何使用拥有控制权,即使这些数据在公共领域中可获得。」但 Henein 不确定美国的法律体系是否会同意这一观点。

Clarkson 律师事务所的管理合伙人 Ryan Clarkson 在该公司的博客文章中表示,现在必须立即行动,利用现有法律,而不是等待行政和司法部门对人工智能做出反应并进行联邦监管。「我们无法承担像社交媒体或核技术一样的负面后果的代价,作为一个社会,我们所付出的代价太高了。」

举报

  • 相关推荐
  • OpenAI 宣布自 GPT-4 发布以来的最大更新:ChatGPT 现在可以「看、听、说」

    OpenAI宣布,其聊天机器人ChatGPT现在可以「看、听、说」,或者至少能够理解口语,用合成的声音回应并处理图像。这次更新是自引入GPT-4以来OpenAI最大的一次改进。但该公司还指出,在此过程中转录被视为输入,并可能用于改进大型语言模型。

  • 突发!ChatGPT可实时联网,OpenAI终于打开捆龙锁啦!

    9月28日凌晨,OpenAI在社交平台宣布,ChatGPT正式提供原生联网功能,可实时查询网络最新消息,并附带原始链接。OpenAI表示,ChatGPTPlus和企业版用户可直接使用该功能,未来会扩展至所有用户全体。ChatGPT作为生成式AI领域的领头羊之一,却一直没有开放联网功能,长时间下去会造成用户流失的情况。

  • 淘宝,多了一个“ChatGPT”入口

    正在悄然切换,进入AI时代。现在打开淘宝,搜索“淘宝问问”,你可以直接跳转到一个全新的页面。它还不是最终形态,如何让电商和AI更好地结合,找到那条打通最佳的用户体验和购物链路的路径,才是真正的挑战。

  • 重磅!OpenAI将发布DALL·E 3,多模态ChatGPT来了!

    9月21日凌晨,OpenAI在官网宣布,在今年10月份将通过API向ChatGPTPlus和企业版用户提供全新文本生成图片产品——DALL·E3。ChatGPT在DALL·E3加持下将开启久违的多模态输出模式,用户通过文本就能直接在ChatGPT中生成各种类型图片。从展示可以看出,DALL·E3可以生成写实、二次元、平面、创意、朋克、3D等多种类型的图片。

  • OpenAIChatGPT不再局限于2021年前的数据 可浏览互联网

    凤凰网科技讯9月28日,OpenAI称,ChatGPT不再局限于2021年之前的数据;ChatGPT现在可以浏览互联网。自去年11月上线以来,ChatGPT用户一直要求以各种形式让这个大语言模型接入更多数据,3月24日,OpenAI宣布部分解除了ChatGPT无法联网的限制。5月,OpenAI宣布发向所有ChatGPTPlus用户开放联网功能和众多插件,当时ChatGPT相关插件已超过70个。

  • OpenAI创始人最新演讲:不要做套壳ChatGPT,建议多研究AI医疗和AI教育

    OpenAI是当下AI产业的风向标,据TheInformation报道,OpenAI的年营收已达到13亿美元,其爆发式增长提振了AI产业的信心。9月24日的美国旧金山举行的YC校友会上,OpenAI创始人兼CEOSamAltman的演讲无疑是当天最火爆的,台下挤满了前来学习和交流的创业者。“人们可以原谅人类犯错,但不能原谅计算机”,SamAltman强调人们对计算机采用的标准是不同的,创业者应当意识到这一点,并确保A

  • OpenAI表示将继续免费提供ChatGPT,不追求快速盈利

    OpenAI在其网站上发布了一份“严肃的解释”,以反驳有关该公司的错误信息并澄清其使命。OpenAI表示,其使命是继续开发至少与人一样聪明、造福全人类的人工智能,同时限制员工和投资者的经济收益。微软回应称,他们正在不断改进技术,Bing聊天机器人使用了OpenAI和微软语言模型的混合。

  • ChatGPT 的所有者 OpenAI 正在探索制造自己的人工智能芯片

    ChatGPT背后的OpenAI公司,正在考虑制造自己的人工智能芯片,并已评估潜在的收购目标。根据最近的内部讨论,公司尚未决定是否继续前进。英伟达是少数几家生产有用的人工智能芯片并主导市场的芯片制造商之一。

  • 贝恩咨询与OpenAI合作,基于ChatGPT打造生成式AI助手Sage

    2023年10月2日,全球三大咨询公司之一贝恩咨询宣布,将与OpenAI合作,将基于OpenAI的GPT-4大语言模型以及自身海量专业咨询数据,打造的生成式AI助手Sage,为18,500名员工提供服务。Sage是基于GPT-4大语言模型打造成,通过贝恩自身积累的海量专业数据,用问答的方式可在几秒内便能生成各种内容。随着生成式AI技术的不断发展,其在企业咨询领域的应用将更加广泛。

  • 开了眼的ChatGPT真让人开了眼了

    给自己放个假吧ChatGPT,再更新的这么快,网友的脑洞可就跟不上了。ChatGPT宣布了一次重要更新,然后有了全面的多模态能力。

今日大家都在搜的词: