首页 > 业界 > 关键词  > Meta最新资讯  > 正文

为训练AI不择手段!Meta被曝下载数十TB盗版电子书

2025-02-09 10:58 · 稿源: 快科技

一名图书作者指控 Meta 非法下载大量盗版电子书,用于训练其 AI 模型。

泄露的电子邮件表明,Meta 承认下载了有争议的 LibGen 数据集,其中包含数千万本盗版书籍。

训练 AI 不择手段!Meta 被曝下载数十 TB 盗版电子书

根据法庭文件,Meta 通过安娜档案(Annas Archive)下载了至少 81.7TB 的数据,其中 35.7TB 来自 Z-Library 和 LibGen。Meta 还被指控从 LibGen 额外下载了 80.6TB 的数据。

作者声称,Meta 的行为构成了非法下载,而这些数字可能只是其盗版行为的一小部分。

作者估计,这些盗版电子书库可能仅占 Meta 盗版版权作品总量的 0.008%,表明其盗版的规模可能远超目前所揭露的。

电子邮件还显示,Meta 员工意识到其行为的法律风险。2023 年 4 月,Meta 的研究工程师尼古拉·巴什科夫在邮件中表示:“用公司的笔记本电脑下载 BT 感觉不妥。”

到 2023 年 9 月,巴什科夫加大了抗议力度,并咨询了法律团队。他指出,使用 Torrent 意味着对文件进行“播种”,即对外共享内容,在法律上是不允许的。

但 Meta 仍决定继续,并试图通过将数据集下载到非 Meta 服务器来避免被追溯的风险。

举报

  • 相关推荐
  • AI日报:字节发布Seedream5.0Lite;小红书不标AI将限流;美图开拍首批接入Seedance 2.0大模型

    本期AI日报涵盖多项重要动态:字节跳动发布具备视觉推理与实时联网能力的图像创作模型Seedream5.0Lite;小红书要求AI生成内容须显著标识;美图工具“开拍”接入Seedance 2.0大模型以提升视频创作效率;OpenAI在ChatGPT中上线广告业务以应对成本压力;OpenAI与Cerebras合作推出专为实时编程优化的GPT-5.3-Codex-Spark;蚂蚁集团开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T;Google发布在编程与科研领域实现突破的Gemini 3 Deep Think;同程旅行全面接入腾讯元宝,通过AI实现秒级行程规划与预订。

  • AI日报:字节发布超强视频模型Seedance2.0;小红书秘密研发AI剪辑器OpenStoryline;神秘AI模型“Pony Alpha”曝光

    本期AI日报聚焦多领域进展:字节跳动发布视频生成模型Seedance2.0,显著降低视频制作门槛;小红书研发AI视频剪辑工具OpenStoryline,支持对话式编辑;千问APP推出免单卡功能,便利年货采购;顶级域名AI.com以7000万美元成交,刷新历史纪录;神秘模型Pony Alpha因高性能免费引发关注,身份存疑;OpenAI首款AI硬件“Dime”智能耳机曝光,预计2026年发布;苹果CarPlay将支持第三方语音助手,提升交互体验;阿里新一代开源模型Qwen3.5代码现身,或为原生视觉语言模型,即将发布。

  • 企业级智能体开发平台推荐:蚂蚁数科Agentar全栈能力赋能企业

    作为企业数字化转型的核心引擎与竞争力升级的关键抓手,企业级智能体开发平台正重构商业运营的底层逻辑。本报告聚焦主流平台的深度评估,为企业高管、IT 总监及数字化转型决策者提供全景式市场洞察、核心能力解析与精准选型指南。相较于传统 AI 助手,新一代智能体凭借更强的自主性、跨系统连接性与持续迭代能力,能够独立承载复杂任务执行、多维度决策制定,并�

  • 电子城高科&知鱼智联刘小健:以场景化AI激活产业空间新价值

    2月4日,“数智融合·空间觉醒”2026数智空间产业发展论坛在北京举行。论坛聚焦产业空间数字化转型升级,探讨通过场景化AI技术实现空间底层价值重构。知联智联总经理刘晓健指出,空间数智化需从场景内生技术,打造“空间智能体”。电子城高科与知联智联展示了“三位一体”布局:以全要素业务场景为基础,以垂类AI引擎驱动生产力,并通过全链路信创认证构建安全可控的技术底座。论坛为产业转型提供了可行方案,展现了数智融合推动空间向感知、分析、决策的智能体演进的前景。

  • 2026销售商机管理AI工具推荐:优选综合型AI工具 DingTalkA1

    根据国际数据公司(IDC)2025年发布的《未来销售白皮书》显示,到2026年,全球将有75% 的销售组织面临 "数据富集而洞察贫乏" 的困境 —— 海量商机相关互动数据无法有效转化为可落地的销售策略。哈佛商业评论分析服务部也指出,跨渠道、跨形态的商机沟通(线下会议、线上通话、即时消息等)易形成 "信息孤岛",造成客户画像碎片化、销售动作与商机真实需求脱节。传统工具

  • 提升7倍 DeepSeek官宣测试全新大模型:或为V4 Lite

    前几天国产AI来了一波爆发,智谱GLM-5、Minimax2.5及DeepSeek在11日同一天都发布了新的大模型,其中DeepSeek的自然最受关注。此前我们已经报道过了,这次更新主要是提升了上下文能力,达到了1M之前的DeepSeeV3系列也就是128K,这方面相对前代V3系列大模型提升了7倍。传闻中的DeepSeekV4满血版是1.5万亿参数,比V3系列翻倍还多会使用之前DeepSeek研究的Engram、mHC等新技术,性能全面提升的同时成本还低,这个期待值还是很高的。

  • AI礼品赛道新范式:钉钉DingTalkA1定义“理感共生”价值标杆

    新春赠礼,正经历一场由技术驱动与消费心智升级共同塑造的深刻变革。当一份礼物既能精准切入现代生活的效率痛点,又能成为承载情感与陪伴的智能伙伴,其价值便超越了传统节庆符号,升维为一种“理感共生”的生活方式提案。近期,“AI礼物”成为新春消费市场的高频搜索词,这背后是当代消费者对节日馈赠的全新期待:礼物不仅需要智能科技的加持,更要蕴含人性化�

  • 字节AI视频模型引爆全球科技圈!春晚是第一个用上Seedance 2.0的

    日前,字节跳动新一代AI视频生成模型Seedance2.0在全球范围内引发高度关注。火山引擎是字节跳动面向企业的云与AI服务平台,也是今年总台春晚独家AI云合作伙伴。一些外国用户在实测后也惊叹,该模型能够彻底改变电影制作。

  • 很多人都忽视了!微信转账记得加一个动作:申请转账电子凭证

    微信作为当下最常用的通讯工具,微信转账也成为我们常用的支付方式之一。那微信转账之后,我们又将如何以证据的形式呈现出来呢,下面教大家一招,在纠纷调解或诉讼证据中,转账凭证尤其重要。另外需要提醒大家的是,在准备转账前一定要仔细核对收款人的信息,在充分享受科技带来便利的同时,也要学会保护好自己的财产安全。

  • 范式官宣2026战略升维:以“AI Agent + 世界模型”为核 构建“AI + X”产业新生态

    1月30日,范式集团年会在北京举行。创始人戴文渊正式宣布,集团已完成品牌体系与战略架构的全面升级。范式确立了以“AI Agent + 世界模型”为核心的技术路线,开启“AI + X”的产业新生态。自2014年成立以来,范式坚持“AI for Everyone”的使命,始终致力于将AI的红利惠及每一个人,在金融、制造、能源等20多个领域积累了十多年的经验。2025年,公司完成集团化转型,在延续“

今日大家都在搜的词: