首页 > 业界 > 关键词  > Meta最新资讯  > 正文

为训练AI不择手段!Meta被曝下载数十TB盗版电子书

2025-02-09 10:58 · 稿源: 快科技

一名图书作者指控 Meta 非法下载大量盗版电子书,用于训练其 AI 模型。

泄露的电子邮件表明,Meta 承认下载了有争议的 LibGen 数据集,其中包含数千万本盗版书籍。

训练 AI 不择手段!Meta 被曝下载数十 TB 盗版电子书

根据法庭文件,Meta 通过安娜档案(Annas Archive)下载了至少 81.7TB 的数据,其中 35.7TB 来自 Z-Library 和 LibGen。Meta 还被指控从 LibGen 额外下载了 80.6TB 的数据。

作者声称,Meta 的行为构成了非法下载,而这些数字可能只是其盗版行为的一小部分。

作者估计,这些盗版电子书库可能仅占 Meta 盗版版权作品总量的 0.008%,表明其盗版的规模可能远超目前所揭露的。

电子邮件还显示,Meta 员工意识到其行为的法律风险。2023 年 4 月,Meta 的研究工程师尼古拉·巴什科夫在邮件中表示:“用公司的笔记本电脑下载 BT 感觉不妥。”

到 2023 年 9 月,巴什科夫加大了抗议力度,并咨询了法律团队。他指出,使用 Torrent 意味着对文件进行“播种”,即对外共享内容,在法律上是不允许的。

但 Meta 仍决定继续,并试图通过将数据集下载到非 Meta 服务器来避免被追溯的风险。

举报

  • 相关推荐