AI也会得老年痴呆！研究：AI版本越老越糊涂

2024-12-20 17:05 · 稿源：快科技

一项突破性研究指出，人工智能（AI）正经历着一种类似于数字痴呆症的认知障碍。

以色列特拉维夫大学的研究人员评估了多款领先的AI语言模型，包括ChatGPT的新旧版本和Gemini的新旧版本。他们采用蒙特利尔认知评估量表对其进行测试，这是评估老年痴呆症的标准工具。

令人惊讶的是，研究发现这些AI模型表现出与早期老年痴呆症相似的认知缺陷。GPT-4o是表现最佳的模型，获得26分（满分30分），而GPT-4则获得25分。然而，Gemini 1.0仅获得16分。

研究还表明，这些模型在视觉空间推理和执行任务等方面存在显著缺陷。它们难以表现出同理心或准确解释复杂的视觉场景。

研究人员强调，这些弱点表明AI尚未做好在临床环境中替代医生的准备。他们得出结论，AI的认知障碍类似于数字痴呆症，限制了它们在医疗保健领域的应用。

（举报）

相关推荐

关键词：

陈天桥在AIAS上首提“发现式智能”，宣告AI研究新范式

2025年10月27-28日，AI驱动科学研讨会（AIAS 2025）在美国旧金山举行。陈天桥发表主题演讲，首次提出“发现式智能”概念，指出这是真正的通用人工智能，强调AI应帮助人类发现未知而非替代人类。他提出实现路径需结合规模路径与结构路径，并分析大脑时间结构包含神经动力学、长期记忆、因果推理、世界模型和元认知五大能力。会议宣布投入超十亿美元建设算力集群，支持年轻科学家探索智能本质。

AI驱动科学发现式智能通用人工智能
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
AI 无人测试：破解金融机构数字化转型的质量与效率困局

金融机构数字化转型面临双重挑战：既要快速迭代高频业务满足用户即时性需求，又需在严监管下保障系统安全合规。传统测试因效率低、成本高难以应对复杂场景，而AI驱动的“无人测试”通过三阶段演进（辅助生成→协同执行→自主决策）实现质效双升。实践显示，AI测试可将周期缩短70%、成本降30%，并自动生成合规报告。未来75%金融机构将采用AI增强测试方案，国内厂商如Testin云测更适配本土合规需求。无人测试已成为兼顾业务增长与风控的战略选择，推动行业进入高质量、高效率、高合规新阶段。

金融机构数字化转型金融软件测试 IT预算管理
每天刷手机青少年认知能力显著下降：高频互动或致语言记忆下滑

加州大学研究团队在《美国医学会杂志》发表研究，追踪6500名9至13岁青少年社交媒体使用行为。研究发现，社交媒体使用时长增加与认知能力下降存在显著关联，尤其影响语言流畅度、工作记忆等核心功能。研究指出，社交媒体高频互动特性会切割注意力，干扰大脑深度信息处理能力。专家建议家长关注使用模式而非单纯限制时间，结合个体认知特点制定干预策略，引导青少年建立健康媒介使用习惯。

社交媒体认知能力青少年研究
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈，而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试，可提升测试效率300%、降低成本30%，并将产品发布周期从"月"压缩至"周"。这不仅是技术升级，更是重构IT成本结构、实现降本增效的战略支点，助力IT部门从成本中心转型为价值创造中心。

IT预算规划数字化战略 AI大模型
如何检查你的网站是否被大模型引用？AI排名查询工具推荐

本文探讨AI搜索时代网站流量获取新逻辑：传统SEO因Google搜索"零点击"现象失效，而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口，并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议：建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代，内容被LLM引用已成为新的流量生命线。
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

阿里云启动双十一“AI智慧季”大型优惠活动，聚焦企业多元AI场景落地需求，推出7000万tokens大模型免费体验、GPU新客特惠等政策，助力企业降低开发成本。同时提供标准化AI产品与解决方案，覆盖内容创作、智能客服等高频应用场景，并举办系列技术分享活动，携手企业拥抱AI新时代。

AI技术阿里云双十一优惠
“AI+文旅”释放赋能效应，数字王国推动综合型体验落地上海

全球顶级视觉特效公司数字王国计划联合多家国际企业，在上海打造以人工智能为技术支撑、融合多个国际知名IP的综合性文旅项目。该公司拥有30年虚拟人、视觉特效技术积累，曾获奥斯卡奖项，并开发虚拟人邓丽君等经典IP。项目将结合VR/AR/MR技术，推出沉浸式体验，并计划引入好莱坞电影IP及中国原创文化内容，构建全球化沉浸体验空间。此举旨在推动科技与文化融合，助力上海静安、杨浦两区打造城市新地标与文旅新生态。

人工智能文旅项目视觉特效

今日大家都在搜的词：

热文

3 天
7天

AI也会得老年痴呆！研究：AI版本越老越糊涂

陈天桥在AIAS上首提“发现式智能”，宣告AI研究新范式

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

AI 无人测试：破解金融机构数字化转型的质量与效率困局

每天刷手机青少年认知能力显著下降：高频互动或致语言记忆下滑

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

如何检查你的网站是否被大模型引用？AI排名查询工具推荐

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

“AI+文旅”释放赋能效应，数字王国推动综合型体验落地上海

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

何小鹏回应机器人IRON里是真人质疑：感谢认可

站长商机