互联网时代下 AI 与人类创造力的角逐：当 AI 向 AI 生成数据学习时「模型崩溃」将引发混乱

2023-06-15 10:54 · 稿源：站长之家

站长之家(ChinaZ.com) 6月15日消息:在大型语言模型（LLM）越来越多地依赖于 ChatGPT 和其他工具来提高效率的情况下，我们可以预见到未来很大一部分网络内容将由人工智能生成。然而，这可能对大型语言模型的未来构成严重风险，因为目前它们依赖于从网络上抓取的人类生成数据。

OpenAI ChatGPT，人工智能，AI

剑桥大学、牛津大学、多伦多大学和伦敦帝国理工学院的一组研究人员发表了一篇研究论文，对 LLMs 最终使用人工智能生成数据作为训练数据提出了警告。这篇名为《递归的诅咒：在生成数据上训练会让模型遗忘》的论文描述了一种退化过程，称为「模型崩溃」，在这种过程中，模型与现实脱节，并被自己的输出内容所破坏。

随着人工智能工具的广泛使用，这种情况很可能会发生。广泛使用人工智能将导致人工智能生成的内容被作为大型语言模型的训练数据，从而导致其输出的不准确和失真。

这个问题在大型语言模型、变分自编码器和高斯混合模型中都有观察到，随着时间的推移，它们开始「遗忘真实的基础数据分布」，因为它们所训练的数据变得污染程度很高，不再与真实世界的数据相似。

鉴于模型崩溃的严重风险，研究人员强调了获得原始分布数据的重要性，这些数据通常由人类生成。毕竟，人工智能语言模型旨在与人类进行交互，因此需要与现实保持联系，以正确模拟我们的世界。

为解决这个问题，研究人员提出了几种更智能的大型语言模型训练方法。其中一种方法是「先发优势」，强调保留对原始人工生成数据源的访问权限。

然而，由于很难区分 AI 生成的数据和人类生成的数据，该研究论文明确提出，「社区范围的协调」对于确定数据来源至关重要，以确保涉及 LLM 创建和部署的各方共享所需的信息。

论文补充说，但在人们越来越广泛地使用生成式人工智能和对技术占据岗位的担忧之间，对于人类创作者来说也存在一线希望。

研究论文推测，随着互联网上生成式人工智能数据的增加，人类创造的内容将变得越来越有价值，即使只是作为训练大型语言模型时的无污染数据来源。

（举报）

相关推荐

关键词：

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
荐谁能成为中国的ChatGPT？夸克抢先交卷

在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周，微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器，夸克则在国内推出了新的「对话助手」功能。这一系列消息背后，新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化，入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式，自然语言就是未来的编程语言。在海外市场，OpenA

AI浏览器 ChatGPT Atlas
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

传统SEO追求"谷歌首页排名"，生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法，更像黑箱，使内容创作者困惑。GEO优化的核心是让内容具备"可引用性"：权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率"，分析引用语境、竞争差距，调整内容结构以提升AI引用倾向。SEO优化机器如何找到你，GEO则优化AI如何引用你。

SEO优化 AI引用内容权威性
GEO如何改变ChatGPT搜索和Perplexity的游戏规则

本文对比ChatGPT与Perplexity两大AI搜索平台：ChatGPT作为全能型助手，整合搜索与多任务处理，但存在信息时效性不足；Perplexity专注垂直搜索，强调引用透明与权威来源。针对AI搜索优化（GEO），提出差异化策略：面向ChatGPT需构建结构化知识库、强化品牌实体识别；面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具，通过曝光率等指标量化内容在AI生态中的可见度，并给出可落地的优化行动方案。
如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

本文探讨AI搜索时代品牌面临的"隐身危机"，指出AI搜索用户年增538.7%，但品牌在AI回答中提及率不足20%。提出三大核心策略：1）构建权威背书矩阵，通过知乎等高权重平台获取自然提及；2）优化AI友好内容，采用对话式标题和结构化数据；3）建立数据监测闭环，通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现，避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

文章搜索核心标签 SEO优化

今日大家都在搜的词：

热文

3 天
7天

互联网时代下 AI 与人类创造力的角逐：当 AI 向 AI 生成数据学习时「模型崩溃」将引发混乱

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

荐谁能成为中国的ChatGPT？夸克抢先交卷

人工智能巨头OpenAI拟上市估值或高达1万亿美元

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

GEO如何改变ChatGPT搜索和Perplexity的游戏规则

如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

鸿蒙智行新款享界S9官宣11月7日开订

问界M7提车关爱计划发布：等车超10周最高可补贴10000元

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机