首页 > 业界 > 关键词  > 正文

研究表明ChatGPT-4在测试对儿童病例诊断的错误率为83%

2024-01-04 10:40 · 稿源:站长之家

站长之家(ChinaZ.com)1月4日 消息:最近一项发表在《JAMA Pediatrics》的研究表明,大型语言模型ChatGPT的最新版本ChatGPT-4在诊断儿科病例时的表现令人失望。

研究由纽约科恩儿童医学中心的研究人员完成。他们让ChatGPT-4尝试诊断100个来自两大医学杂志的已发表儿科病例。这些病例都是作为测试案例发布的,需要临床医生根据症状和表现进行诊断。

结果发现,ChatGPT-4只能正确诊断17%的病例。在72%的病例中,它给出了错误的诊断。还有11%的病例,其给出的诊断过于宽泛,没有完全捕捉到正确的病症。

AI研究 AI医疗 医生

研究人员分析发现,ChatGPT-4在建立某些疾病之间的已知联系上比较薄弱。例如,它没有将儿童自闭症链接到可能的维生素缺乏。另外,它也时常忽略常见病症而提出一些罕见诊断。

此外,该研究强调了临床医生丰富的经验在复杂诊断中的重要性。虽然AI系统具有潜力,但目前看来尚未准备好取代人类医生,尤其是在较为棘手的儿科病例上。

研究人员认为,可以通过使用准确可信的医学文献来专门训练ChatGPT,并允许其实时获取病例数据进行“调谐”,来提高其诊断的准确性。

尽管该研究有其局限性,但它确实突出了当前AI系统在临床应用上面临的一些困难。儿科病例尤其复杂多变,对机器提出了巨大挑战。但研究人员还是对AI机器人未来在辅助医疗决策中发挥重要作用持乐观态度。

举报

  • 相关推荐
  • ChatGPT周活跃用户已超8亿!OpenAI即将推出升级版聊天模型

    近日,OpenAI首席执行官奥尔特曼正向员工和投资者表示,公司的发展势头依旧向好。 一份内部Slack通讯消息显示,奥尔特曼于上周五向OpenAI员工透露,ChatGPT月度增长率重回10%以上。 ChatGPT的周活跃用户虽然已超8亿,但谷歌和Anthropic的市场份额正持续提升。 他还表示,OpenAI还将推出一款升级后的聊天模型”。

  • 品牌AI搜索监控怎么做?GEO Base工具帮你追踪ChatGPT、通义千问等平台提及

    随着AI助手逐步取代传统搜索引擎,品牌曝光逻辑发生根本转变。过去SEO聚焦关键词排名,如今数字营销需应对更复杂挑战:当用户向AI提问时,品牌能否出现在答案中?这催生了全新优化范式——GEO(生成引擎优化),其核心在于管理品牌在AI生成答案中的表现。AIBase推出的GEO品牌监控工具,通过每日监测超千万次AI对话,提供品牌可见性指数、情感分析、竞品对比及引用溯源

  • 守护儿童健康,呼吸道感染季备药需记牢:儿童需用儿童药

    天气寒冷加之春节临近,呼吸道感染高发。儿童备药需遵循安全优先、对症用药原则,避免盲目用药或重复用药。发热时,体温持续超过38.5℃且伴有精神萎靡等症状可考虑使用退烧药,推荐对乙酰氨基酚或布洛芬的儿童专用剂型,两者不可随意交替使用。咳嗽、咳痰症状可针对性储备止咳化痰药物,如易坦静等。用药务必遵医嘱或说明书,切勿擅自增减剂量或混合同类药物。预防胜于治疗,应避免带孩子前往人群密集场所,培养良好卫生习惯,根据气温及时增减衣物,从源头降低感染风险。

  • 雷军:小米电池包经过一千多项测试 很多测试比国标测试要求高

    小米创办人、董事长兼CEO雷军开启小年夜直播。 直播期间,雷军介绍了小米汽车的电池安全技术。他表示,小米汽车电池包采用电芯排布方案,在每一排电芯后方均设置双大面水冷结构。一旦某一电芯出现异常失效,该结构可快速带走热量,这样的话会提升安全性。 此外,除了有双大面冷却,电池包还有水冷板,能够帮助电池尽快的散热,并且在电芯和电芯之间还有气凝胶�

  • AI日报:ChatGPT Atlas 浏览器重大更新;通义正式开源 Qwen3-TTS;Optimus 机器人2027年公售

    本期AI日报聚焦多项AI领域进展:OpenAI升级Mac版ChatGPT Atlas浏览器,新增标签分组与自动导航搜索;可灵AI月入2000万美元,成为快手重要盈利引擎;阿里通义千问开源Qwen3-TTS语音模型,实现超低延迟与实时合成;马斯克透露Optimus机器人计划2027年公开销售;Agentation工具发布,助力开发者精准定位代码元素;OpenAI Codex集成至JetBrains全家桶,提升编程效率;腾讯发布反舞弊通报,AI建�

  • 买到2026年3月1日产面包 商家赔偿:打印错误导致

    近日,江苏常州一名男子在购买面包时,发现包装上标注的生产日期竟为2026年3月1日,这一日期明显早于实际购买时间,该异常情况迅速引发社会关注。 事件发生后,涉事商家迅速作出回应,称此次问题是由于日期打印环节出现错误所致。商家表示,已第一时间与该消费者取得联系并协商处理,最终给予了消费者相应的赔偿,以表歉意并弥补其损失。 此次“早产”面包事件�

  • 儿童咳嗽别乱用药!有痰无痰差异大,选对方式才安心

    本文针对儿童咳嗽问题,指出家长常因担心肺炎而过度焦虑。咳嗽是身体的保护性反射,有助于排出异物和痰液,强行止咳反而可能导致痰液积聚,引发感染。处理核心在于祛痰而非止咳,应遵医嘱使用祛痰药物如易坦静,并避免自行使用止咳药。日常护理需注意清淡饮食、多喝温水,并学会识别危险信号,如咳嗽深重、痰咳不出或伴有喘息等,需及时就医。科学用药和规范护理才能有效帮助孩子恢复健康。

  • 雷军晒新一代SU7照片:称参加过多次测试

    小米创始人雷军2月12日在微博晒出新一代SU7测试车照片,并配文“开始一天的工作了”,引发网友热议。照片中雷军亲自驾驶测试车,展现对产品的热情与专注。面对网友“雷总还是亲自开车测试吗”的疑问,雷军肯定回复,透露自己不仅多次参与测试,还亲自完成北京到上海的高速测试,足见对质量的严格把控。作为CEO,雷军现阶段将大量精力倾注于汽车业务,旨在深入了解产品特性,持续完善性能,确保交付车辆达到最高标准。此前雷军表示,新一代SU7预计4月正式上市,小米团队将全力以赴,打造梦想之车。目前新车已开启预定,提供标准、Pro、Max三个版本,预售价分别为22.99万、25.99万和30.99万元。

  • 只花0.99元3分钟就能诊断抑郁症 专家:切勿轻信

    在互联网公司工作的李先生花了0.99元购买了一套测试题,3分钟答完100道题后确认”自己得了轻度抑郁症。 在电商平台上,搜索抑郁症测试题”就能看到多家店铺在销售类似的题目,电子版价格通常不到1块钱,店家声称该测试题能自测焦虑、抑郁症等等。 对此,专家提醒,区分情绪问题是否正常,仅靠

  • 多闻屁味有好处!研究发现硫化氢有助保护大脑 逆转阿兹海默症症状

    一向被视为有毒、具腐蚀性,且散发腐烂鸡蛋气味的硫化氢,未来可能不再只是危险气体。 来自约翰霍普金斯医学中心的研究团队在动物实验中发现,硫化氢可能在老化过程中,对大脑细胞发挥保护作用,甚至有助改善阿兹海默症相关症状。 研究团队指出,人体本就会自然产生少量硫化氢,这种气体也常被视为肠道排气气味的来源之一,同时参与细胞代谢、血管扩张等多项�

今日大家都在搜的词: