首页 > AI头条  > 正文

AI 也会 “脑损伤”?研究揭示低质量数据对大语言模型的影响

2025-11-17 09:05 · 来源: AIbase基地

最近,一项引人关注的研究表明,大语言模型(LLM)在持续接触低质量数据后,会出现类似于人类的 “脑损伤” 现象,导致推理和记忆能力显著下降。研究者发现,AI 模型在接受高流行但低价值的社交媒体数据(如 Twitter)训练后,推理能力下降了23%,长上下文记忆能力下降了30%。而更令人担忧的是,这种损伤是不可逆的,即使在后续用高质量数据进行训练,模型也无法完全恢复到初始状态。

问卷调查,数据报告

图源备注:图片由AI生成,图片授权服务商Midjourney

这项研究由一组 AI 研究者进行,他们对低质量数据进行了详细定义,并与高质量数据进行对比。他们将低质量数据归类为 “短文本、高热度” 的内容,特别是那些包含标题党和流行语的社交媒体帖子。研究表明,AI 模型接触这些低质量数据后,除了认知能力下降外,其人格特征也受到影响,表现出更多的自恋和精神病态特质。

研究团队选择了四个不同的大语言模型进行训练,分别让它们接受这两类数据。研究过程中,模型的核心能力通过多种维度进行评估,包括推理能力、记忆能力和道德规范的遵循。结果显示,“垃圾进垃圾出” 的原则确实适用于大语言模型,这一发现对未来的 AI 数据训练提出了新的警示。

研究人员认为,行业在训练 AI 时,必须关注数据的质量,避免低质量数据带来的潜在风险。此外,他们还建议在部署大模型时,应进行认知能力的基准测试,以确保 AI 不因长期接触低质量数据而导致能力退化。

划重点:

🧠 AI 模型在接触低质量数据后,推理和记忆能力显著下降,且损伤不可逆。  

📉 接触低质量数据后,AI 模型表现出更多自恋和精神病态特质。  

🔍 研究提醒,训练 AI 时要重视数据质量,并进行认知能力测试。

  • 相关推荐
  • 科杰科技入选赛迪AI Infra平台市场研究报告,引领Data&AI数据基础设施新范式

    近日,赛迪顾问发布《2025中国AI Infra平台市场研究报告》,全面梳理中国AI基础设施平台市场格局、技术趋势与竞争态势。报告显示,2024年中国AI Infra平台市场规模达345亿元,预计2025年将飙升至673亿元,同比增长95.1%。企业AI应用正从单点验证迈向嵌入核心业务流的深度阶段,对基础设施提出更高要求。科杰科技凭借Data&AI融合架构、湖仓一体引擎及企业级AI落地能力强势入选,位列“挑战者”象限,彰显其在Data&AI领域的领先地位。

  • 具身智能产业迎来爆发期:十大观察揭示未来发展蓝图

    上海财经大学数字研究院近日发布报告指出,具身智能正从实验室走向规模化应用,成为推动高质量发展的新增点。报告从技术突破、产业瓶颈、应用场景等十个维度剖析了该领域发展态势,强调大模型与多模态技术正开启新篇章。当前面临芯片性能、数据标准、硬件成本、模型安全等挑战,产业呈现“上游依赖进口、中游集成难度大、下游需求旺盛”格局。市场竞争呈现巨�

  • OceanBase发布首款AI数据库seekdb:三行代码构建AI应用 实现百亿级多模数据混合搜索

    今日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)。 开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现开箱即用”的AI数据基座。 该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架。 这一�

  • 卖家精灵再度亮相四川工贸会,以AI+大数据赋能“川品出海”!

    2025年11月18日,四川省成功举办“川造无界,跨境未来”源头工厂供需对接活动。活动汇聚亚马逊、阿里巴巴等主流平台及400余名跨境卖家与100余家优质工厂,聚焦“川品出海”数字化实践。现场展示AI选品工具“卖家精灵”,通过数据化、智能化助力企业打通“数据选品—精准对接—高效出海”闭环。四川省领导莅临指导,肯定AI与大数据赋能成效。活动覆盖家居、汽配等热门品类,推动供应链直选,构建跨境服务生态,为四川制造走向全球提供持续支撑。

  • 魏牌高山质量可靠吗?多维度实力给出肯定答案

    随着消费升级,魏牌高山7以可靠品质打破MPV工具车刻板印象,成为家庭出行信赖之选。外观融入中式美学,获清华教授认可;内饰定位“移动大客厅”,5050mm车长与61.1%得房率保障同级最优空间。配备2.5K双联屏、23扬声器及可调温冰箱,兼顾影音娱乐与实用需求。福福祉版搭载升降座椅,精准契合老年群体需求。演员孙越称赞其“稳当灵動”,印证产品严谨性与人文关怀。魏牌高山以全面实力重塑MPV价值标杆。

  • 马斯克xAI发布Grok 4.1:响应速度和回答质量显著提升

    埃隆·马斯克旗下xAI公司于11月18日发布聊天机器人Grok 4.1版本。该版本在响应速度、回答质量及理解用户意图方面显著提升,支持“思考模式”深度推理与“非推理模式”即时回复。测试显示其情商、创意写作表现突出,幻觉率从12%降至4.2%。目前已在官网、X平台及苹果谷歌商店上线,并整合进特斯拉车辆。竞争对手包括ChatGPT、Gemini等主流AI助手,行业竞争日趋激烈。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 亿信华辰新书《数据治理项目实施指南》发布,为企业数据治理提供全景式实战蓝图

    2025年11月17日,亿信华辰在第四届数据治理年会上发布新书《数据治理项目实施指南》。该书针对企业数据治理中“起步难、落地慢、见效迟”的共性难题,提供从战略到执行的全周期方法论支撑。核心价值包括厘清治理战略、提供实战方法、启发场景化应用及建立持续运营机制,通过“方法论+场景化+案例库”体系,结合多行业实践案例,为企业数字化转

今日大家都在搜的词: