OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4

2024-04-07 09:28 · 稿源：

站长之家(ChinaZ.com) 4月7日消息:近日，《华尔街日报》报道称，人工智能公司在收集高质量训练数据方面遇到了困难。随后，《纽约时报》详细介绍了一些公司处理这一问题的方法，其中涉及到了人工智能版权法的模糊灰色区域。

故事从OpenAI开始。该公司迫切需要训练数据，据报道开发了Whisper音频转录模型，转录了超过100万小时的YouTube视频来训练其最先进的大型语言模型GPT-4。《纽约时报》报道称，OpenAI知道这在法律上存在问题，但相信这是合理使用。OpenAI总裁格雷格·布罗克曼亲自参与了所使用视频的收集。

youtube 油管

OpenAI发言人林赛·赫尔德告诉The Verge，该公司为每个模型策划了"独特"的数据集，并使用"众多来源，包括公开数据和非公开数据的合作伙伴"。赫尔德还表示，该公司正在考虑生成自己的合成数据。

据《纽约时报》消息人士透露，谷歌也从YouTube收集了文字记录。谷歌发言人马特·布莱恩特表示，该公司"根据我们与YouTube创作者的协议，在一些YouTube内容上训练了模型"。

Meta同样也遇到了良好训练数据可用性的限制。该公司在努力追赶OpenAI的过程中，曾考虑未经许可使用版权作品的情况，包括支付图书许可费用或直接收购一家大型出版商。

这些公司正在努力应对模型训练数据快速蒸发的问题。《华尔街日报》本周撰文称，到2028年，公司可能会超越新内容。解决方案包括对模型创建的"合成"数据进行训练，或采用"课程学习"方法。但这些公司的另一个选择是使用他们能找到的任何东西，无论他们是否获得许可，这可能会引发版权法方面的担忧。

（举报）

相关推荐

关键词：

十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

近日，小女孩“小十三”与十方融海研发的小智AI机器人深情告别的视频走红网络。这段1分17秒的对话不仅让无数网友泪目，更展现了AI技术的情感温度。十方融海团队迅速响应，跨越600公里为女孩送上定制版机器人作为生日礼物，并推出儿童心理陪伴计划。该事件体现了“人工智能+教育”的深刻内涵，彰显科技企业的人文关怀与社会担当，成为“技术向善”的生动实践。
数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

AI数据智能体TabTabAI正式上线，以“零门槛交互+全流程自主处理”为核心优势，打破数据分析技术壁垒。该工具通过自然语言对话，支持多源数据采集、智能处理、深度洞察与可视化，让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力，覆盖从数据收集到决策建议的全链路，助力用户将原始数据高效转化为精准决策依据，真正实现“人人都是数据分析师”。

数据分析数据驱动 AI数据智能体
微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

微算科技开发了延迟和隐私感知卷积神经网络分布式推理技术，通过创新队列机制和深度强化学习优化CNN推理过程，结合分布式计算与隐私保护机制，在降低边缘设备计算延迟的同时强化数据隐私。该技术将推理任务智能分配到不同节点，减少数据传输范围，实现高效推理与隐私安全的平衡，为智能医疗、交通等领域提供可靠解决方案。

人工智能深度学习隐私保护
以品质驱动高质量发展！小熊电器入选2025佛山企业百强

9月27日，2025年佛山市企业家大会召开，发布骨干企业调研及企业百强榜。小熊电器同时入选佛山企业100强、制造业100强及民企100强三大主榜，并跻身国际化及科技创新TOP30子榜。企业凭借高品质驱动发展，以用户需求为导向，通过持续研发创新、严格品控及智能制造，实现营收利润双增长，展现本土领军企业综合实力，印证“品质升级”推动高质量发展的长期价值。

佛山企业百强制造业企业民营企业
荐市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

9月24日，阿里巴巴股价创下四年新高，单日涨超9%，市值达到约3.32万亿港元，一日增加近3000亿港元。引爆股价的，是阿里集团每年一度的云栖大会。在会上，阿里释放多条重磅消息，尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后，阿里的股价表现就出现了明显的拉升。

阿里巴巴云栖大会股价
亮点纷呈 2025郑州软件产业高质量发展系列对接活动启幕

2025年10月14日，郑州软件产业高质量发展系列对接活动开幕，聚焦“汇聚软件全要素+赋能中原新篇章”。活动通过“5+5+N”体系搭建产业对接平台，吸引全国软件企业、专家学者等参与。亮点包括《软件过程能力成熟度模型》国家标准发布、企业数字化转型供需对接及未来金融科技生态专题活动，促成多项合作。郑州近年软件产业规模超1300亿元，此次活动巩固了其在全国软件格局中的重要地位，为数字河南建设注入新动能。

软件产业高质量发展数字化转型
“创新发展 · 绿色未来”——第二十五届磷复肥产销会引领行业绿色高质量发展新征程

第二十五届磷复肥产销会将于2025年11月4-6日在南京举办，主题为“创新发展·绿色未来”。会议聚焦磷资源高效利用、绿色低碳转型等议题，设置政策解读、技术交流及市场分析论坛，展览面积超4.5万平方米，汇聚400余家企业与4万余名专业观众。作为行业重要平台，本届大会将推动磷复肥产业在“十五五”背景下实现高质量可持续发展。

磷复肥产销会化肥行业政策绿色低碳工艺
重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析，覆盖数据获取、建模到可视化全流程。用户可用自然语言交互，系统自主规划任务并输出可维护结果，支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手，旨在降低分析门槛，助力企业高效挖掘数据价值，适用于数据分析师、营销人员等各类用户。

AI数据分析 Multi-Agent系统数据可视化
葡萄酒进口数据：澳洲领跑，解码澳洲红酒黄金版图

澳大利亚葡萄酒产业凭借独特风土条件、丰富品种和卓越品质，已成为全球市场重要力量。文章聚焦巴罗萨谷和石灰岩海岸两大经典产区，分析其地理特征、气候土壤及代表品种，并解读奔富和金锤酒庄的酿造哲学。数据显示，2025年澳洲葡萄酒出口额达248亿澳元，中国市场需求激增123%。产业正向品质驱动转型，两大酒庄通过技术创新与精准营销持续引领市场。

澳大利亚葡萄酒巴罗萨谷石灰岩海岸
“人工智能+”时代，企业做对什么才能抢占先机？

国务院8月26日发布《关于深入实施“人工智能+”行动的意见》，提出加快AI技术与实体经济深度融合，推动产业智能化升级。到2035年，我国将全面步入智能经济和社会新阶段。金蝶集团作为企业数字化服务商，以“AI优先”为战略，将AI技术深度融入SaaS产品与服务，推出金蝶云·星空EMA平台及多款智能产品，覆盖财务、供应链、差旅等场景，助力企业构建“AI+业务”新能力，实现高效管理与创新发展。

人工智能数字化转型产业智能化

今日大家都在搜的词：

热文

3 天
7天

OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4

十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

以品质驱动高质量发展！小熊电器入选2025佛山企业百强

荐市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

亮点纷呈 2025郑州软件产业高质量发展系列对接活动启幕

“创新发展 · 绿色未来”——第二十五届磷复肥产销会引领行业绿色高质量发展新征程

重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

葡萄酒进口数据：澳洲领跑，解码澳洲红酒黄金版图

“人工智能+”时代，企业做对什么才能抢占先机？

今日大家都在搜的词：

热文

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

REDMI K90标准版12+512GB降价300元小米回应：可退差价

小米汽车发布跨年购置税补贴方案至高不超15000元

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

华为nova Flip S小折叠开售：首发3388元起

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

真我GT8发布：售价2899元起骁龙8至尊版双芯

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

余承东官宣华为路由X3 Pro 采用“日照金山”设计

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

站长商机