首页 > 业界 > 关键词  > LLaMA最新资讯  > 正文

LLaMA都在用的开源数据集惨遭下架:包含近20万本书,对标OpenAI数据集

2023-08-21 14:34 · 稿源: 量子位公众号

开源数据集因侵权问题,惨遭下架。如LLaMA、GPT-J等,都用它训练过。如今,托管了它3年的网站,一夜之间删除了所有相关内容。这就是Books3,一个由将近20万本图书组成的数据集,大小将近37GB。丹麦一家反盗版组织表示,在该数据集中发现了150本其成员的书籍,构成侵权,所以要求平

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词: