首页 > 业界 > 关键词  > AI研究最新资讯  > 正文

AI也会得老年痴呆!研究:AI版本越老越糊涂

2024-12-20 17:05 · 稿源: 快科技

一项突破性研究指出,人工智能(AI)正经历着一种类似于数字痴呆症的认知障碍。

以色列特拉维夫大学的研究人员评估了多款领先的AI语言模型,包括ChatGPT的新旧版本和Gemini的新旧版本。他们采用蒙特利尔认知评估量表对其进行测试,这是评估老年痴呆症的标准工具。

令人惊讶的是,研究发现这些AI模型表现出与早期老年痴呆症相似的认知缺陷。GPT-4o是表现最佳的模型,获得26分(满分30分),而GPT-4则获得25分。然而,Gemini 1.0仅获得16分。

研究还表明,这些模型在视觉空间推理和执行任务等方面存在显著缺陷。它们难以表现出同理心或准确解释复杂的视觉场景。

研究人员强调,这些弱点表明AI尚未做好在临床环境中替代医生的准备。他们得出结论,AI的认知障碍类似于数字痴呆症,限制了它们在医疗保健领域的应用。

举报

  • 相关推荐
  • 陈天桥在AIAS上首提“发现式智能”,宣告AI研究新范式

    2025年10月27-28日,AI驱动科学研讨会(AIAS 2025)在美国旧金山举行。陈天桥发表主题演讲,首次提出“发现式智能”概念,指出这是真正的通用人工智能,强调AI应帮助人类发现未知而非替代人类。他提出实现路径需结合规模路径与结构路径,并分析大脑时间结构包含神经动力学、长期记忆、因果推理、世界模型和元认知五大能力。会议宣布投入超十亿美元建设算力集群,支持年轻科学家探索智能本质。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • AI 无人测试:破解金融机构数字化转型的质量与效率困局

    金融机构数字化转型面临双重挑战:既要快速迭代高频业务满足用户即时性需求,又需在严监管下保障系统安全合规。传统测试因效率低、成本高难以应对复杂场景,而AI驱动的“无人测试”通过三阶段演进(辅助生成→协同执行→自主决策)实现质效双升。实践显示,AI测试可将周期缩短70%、成本降30%,并自动生成合规报告。未来75%金融机构将采用AI增强测试方案,国内厂商如Testin云测更适配本土合规需求。无人测试已成为兼顾业务增长与风控的战略选择,推动行业进入高质量、高效率、高合规新阶段。

  • 每天刷手机 青少年认知能力显著下降:高频互动或致语言记忆下滑

    加州大学研究团队在《美国医学会杂志》发表研究,追踪6500名9至13岁青少年社交媒体使用行为。研究发现,社交媒体使用时长增加与认知能力下降存在显著关联,尤其影响语言流畅度、工作记忆等核心功能。研究指出,社交媒体高频互动特性会切割注意力,干扰大脑深度信息处理能力。专家建议家长关注使用模式而非单纯限制时间,结合个体认知特点制定干预策略,引导青少年建立健康媒介使用习惯。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • “大模型应用”新风口:“无人测试”趋势,CIO/CTO如何应对

    当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈,而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试,可提升测试效率300%、降低成本30%,并将产品发布周期从"月"压缩至"周"。这不仅是技术升级,更是重构IT成本结构、实现降本增效的战略支点,助力IT部门从成本中心转型为价值创造中心。

  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • “AI+文旅”释放赋能效应,数字王国推动综合型体验落地上海

    全球顶级视觉特效公司数字王国计划联合多家国际企业,在上海打造以人工智能为技术支撑、融合多个国际知名IP的综合性文旅项目。该公司拥有30年虚拟人、视觉特效技术积累,曾获奥斯卡奖项,并开发虚拟人邓丽君等经典IP。项目将结合VR/AR/MR技术,推出沉浸式体验,并计划引入好莱坞电影IP及中国原创文化内容,构建全球化沉浸体验空间。此举旨在推动科技与文化融合,助力上海静安、杨浦两区打造城市新地标与文旅新生态。

今日大家都在搜的词: