首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

纽约时报指责OpenAI、谷歌和Meta绕过法律边界进行AI训练数据

2024-04-08 09:40 · 稿源:站长之家

划重点:

⭐️ 纽约时报指称 OpenAI、谷歌和 Meta 或许涉嫌为训练他们的人工智能模型采取可疑行为。

⭐️ OpenAI 使用了一种名为 Whisper 的语音识别工具从 YouTube 视频中转录音频,涉及超过100万小时的视频。

⭐️ 谷歌和 Meta 也被指控违反版权,谷歌转录 YouTube 视频用于 AI 训练,Meta 考虑收购 Simon & Schuster 以获取长篇作品。

站长之家(ChinaZ.com)4月8日 消息:据纽约时报报道,OpenAI、谷歌和 Meta 被指控在训练人工智能模型时存在不当行为。

纽约时报的报告指出,OpenAI 使用名为 Whisper 的语音识别工具从 YouTube 视频中转录音频,并据称 OpenAI 员工曾讨论这一行为可能违反视频网站的规则。OpenAI 最终转录了超过100万小时的 YouTube 视频,并由 OpenAI 总裁 Greg Brockman 协助,这些转录被用于训练 GPT-4模型。

机器人阅读读书

图源备注:图片由AI生成,图片授权服务商Midjourney

报道还称,Meta 曾考虑收购出版商 Simon & Schuster 以获取长篇作品用于训练 AI,同时还讨论 “从互联网收集受版权保护的数据,即使可能面临诉讼”,并认为 “与出版商、艺术家、音乐家和新闻行业协商许可将耗费太长时间”。谷歌被指控转录 YouTube 视频以获取文本用于 AI 模型训练,纽约时报称这 “可能” 违反了视频的版权,并称谷歌修改其条款以允许对公开可用的 Google 文档、Google 地图上的餐厅评论和其他在线内容进行数据抓取以用于训练 AI。

纽约时报似乎试图描绘一幅有关大规模侵权的可怕画面,但通常避免直接这样说。这些都是任何开发 AI 的公司应该进行的合理对话,以便善待他人并遵守法律。AI 公司正在做的正是公平使用数据,这也是 OpenAI 对纽约时报诉讼的辩护核心。该报道在17段文字后才披露纽约时报正在起诉 OpenAI,使文章看起来像是针对公司认为是敌人的攻击。

纽约时报的报道引起了关于 AI 公司训练数据的合法性和道德性的讨论,也凸显了 AI 行业在数据获取方面面临的挑战和争议。

举报

  • 相关推荐
  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 百度正式发布AI搜索APP“梯子AI”:主打无广告智能搜索!

    百度旗下的AI搜索AppTizzy.ai”已完成了前期的测试,并正式更名为梯子AI”上架。 这款应用最初于8月10日发布,当时名称为Tizzy.ai”,更新后版本号从1.0.0直接跳至1.2.0。 据介绍,梯子AI定位为智能搜索助手,依托百度多个大模型能力开发而成,主打无广告智能搜索,整合深度思考、资源检索及影视娱乐功能,致力于为用户提供简单搜索,一触即达”的极致体验。

  • AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

    本文介绍了AI日报栏目,聚焦人工智能领域最新动态。主要内容包括:腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能,以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

  • 百度APP发布AI星河计划,构建AIGC创作者全方位扶持体系

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,活动汇聚众多高质量AIGC作品与优秀创作者。百度发布“AI星河计划”,投入亿级流量和千万现金补贴,通过流量扶持、涨粉加速、分成翻倍、多元变现等手段,构建全方位创作者专属成长扶持体系。该计划根据作者AI技术与内容创作能力区分4档创作者,提供定制化支持套餐,最高可享亿级流量池和3倍分成补贴。百度APP依托月活7.35亿流量池与技术优势,已成为AIGC内容平台市场头部玩家,期待与更多优秀创作者共建未来内容生态。

  • DeepSeek:已对AI生成合成内容添加标识 用户不得恶意删除

    今天下午,DeepSeek发布了《关于AI生成合成内容标识的公告》。 公告中称,Deepseek始终高度重视AI的安全问题,已在平台内对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。 此举为贯彻落实《人工智能生成合成内容标识办法》(2025年9月1日起施行)及《网络安全技术 人工智能生成合成内容标识方法》等国家标准的相关要求,防止AI生成内容可能引发的公众混淆、�

  • AI模型库哪个好?2025年主流AI模型选型指南与API成本对比推荐

    AI时代企业核心挑战已从“能否做AI”转向“如何高效集成AI能力”。AI模型库通过聚合全球主流模型,提供透明化成本与能力信息,帮助企业实现快速原型验证、精准选型和成本优化。这种基础设施降低技术门槛,使非技术背景决策者也能深度参与技术选型,加速创新迭代并降低试错成本。

今日大家都在搜的词: