首页 > AI头条  > 正文

医生不敌 AI:ChatGPT 诊断准确率高达 90%!

2024-11-22 09:22 · 来源: AIbase基地

近年来,人工智能在医疗领域的应用不断扩大。最近,一项研究显示,OpenAI 开发的聊天机器人 ChatGPT-4在诊断准确性方面竟超越了医生,引发了广泛的讨论和关注。

该研究发表于《JAMA 网络开放》期刊,测试了50位医生在六个复杂病例上的表现。结果显示,使用 ChatGPT 辅助的医生平均得分为76%,而未使用该工具的医生仅为74%。令人震惊的是,ChatGPT 单独进行诊断时的准确率达到了90%。

AI 医疗

图源备注:图片由AI生成,图片授权服务商Midjourney

研究者为了避免参与者或 AI 模型的先验知识,使用了真实的、未公开的病例历史。这些病例包括一些复杂的医疗状况,比如胆固醇栓塞,这是一种常常被忽视的稀有疾病。医生们在独立医疗专家的评分下,提供可能的诊断、排除替代方案并建议下一步的诊断步骤。尽管许多医生得到了 ChatGPT 的支持,但他们仍然难以匹敌 AI 的表现。

研究揭示了两个主要问题:首先,医生们往固守自己的初始诊断,尤其是在 ChatGPT 的建议与他们的看法相悖时。其次,很多医生没有充分利用 AI 工具的能力,往往只提出狭窄的问题,而未能全面分析病例历史。

专家们认为,现代 AI 工具通过语言模型对复杂病例进行细致分析,展现出了巨大的潜力。与早期计算机辅助诊断不同,现代 AI 工具并不试图模拟人类推理,而是通过处理和预测语言模式而表现出色。

尽管如此,专家们警告说,将 AI 融入医疗工作流程的过程不会一帆风顺。常见的挑战包括缺乏 AI 培训、医生对 AI 的抵触情绪以及有关伦理和法律的担忧。这些因素都可能阻碍 AI 作为 “医生延伸工具” 的潜力,影响其在提高诊断准确性方面的作用。

研究人员在分析聊天记录时发现,许多医生忽视了 ChatGPT 的建议。这种抵制心理部分源于他们对自身专业知识的过度自信,同时也因为缺乏对 AI 诊断能力的了解。

这项研究的结果强调了 AI 开发者与医疗专业人员之间合作的重要性,以增强信任和可用性。未来,AI 在医学中的角色可能会超越诊断,延伸至个性化治疗规划和病人管理等领域。尽管 AI 是一个非凡的工具,但如何有效地将其融入医疗实践中仍然需要大量的努力。

划重点:  

🩺 ChatGPT-4在医疗诊断研究中表现出90% 的准确率,超越了医生使用 ChatGPT 辅助的76% 。

📊 医生们往往对自己的初始诊断过于自信,忽视了 AI 建议。  

🤖 AI 工具在医疗中的潜力巨大,但缺乏培训和信任是当前主要挑战。

  • 相关推荐
  • Custouch市场易AI技术入选Topdigital2025全球AI营销图谱

    《TopDigital2025全球AI营销图谱》近日发布,Custouch市场易入选"内容智能生成"板块。该图谱为AI技术重构营销提供全链路产业地图,整合企业官网、学术报告、专利库等多维度信息。Custouch凭借AI技术在B2B营销领域的创新应用入选,其智能解决方案能有效满足企业实际需求。作为数字营销技术服务商,Custouch已为300+国际头部企业提供一站式营销管理体系,涵盖内容、活动、线索等全流程,助力企业实现高质量增长。此次入选既是对其AI成果的肯定,也是对其未来发展的激励。

  • 高通骁龙8 Elite 2鸡血版曝光:频率高达4.74GHz 史无前例

    博主i冰宇宙爆料,高通骁龙8 Elite 2有高频版本,CPU主频达到了4.74GHz,由三星Galaxy S26系列首发搭载。 据悉,高通骁龙8 Elite的鸡血版主频为4.47GHz,由Galaxy S25系列首发搭载,骁龙8 Elite 2鸡血版主频再度刷新行业纪录,比上代芯片提升了0.27GHz。 这颗芯片仍然由台积电代工,采用台积电第三代3nm制程N3P,配备全新一代Oryon CPU,并集成Adreno 840 GPU,这是安卓阵营内频率最高、性能最�

  • 谷歌Pixel Watch 4外观揭晓:41/45mm双尺寸、5款配色

    谷歌Pixel Watch 4智能手表的官方渲染图目前已提前曝光,此次Pixel Watch 4提供了41mm和45mm两种尺寸,以满足不同用户的需求。 其中,41mm版本拥有黑曜石、瓷器白、柠檬绿和鸢尾紫四种颜色,而45mm版本则提供黑曜石、瓷器白和月光石三种颜色。 从曝光的渲染图来看,Pixel Watch 4的设计延续了谷歌一贯的简约风格,同时在色彩搭配上更加大胆和时尚。

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • 9岁女孩因压力过大近视暴增900度 医生:心源性眼盲

    武汉9岁女孩萌萌突发视力骤降,半个月内近视度数竟从100度飙升至800度,连走路都频繁绊倒。 经全面检查,其眼部晶状体及脑部均无器质性病变,散瞳验光甚至显示远视100度,但视力仍未改善。 医生最终诊断为心源性眼盲一种由心理压力引发的功能性视觉障碍。追问发现,萌萌父母对其学业要求严格,暑假安排了密集培训,加之孩子自我要求高,长期精神紧绷触发病症。

  • 90岁老人确诊乳腺癌 医生提醒:绝经后女性仍需警惕

    ​近日,江苏省中医院乳腺病科接诊了一位特殊患者——90岁的王奶奶(化名),其因左乳肿块破溃就医,最终被确诊为激素受体阳性乳腺癌。这一病例引发医学界对老年女性乳腺健康问题的关注。据家属回忆,两年前老人就曾发现左乳存在肿块,但因无疼痛感未引起重视,直至近期女儿为其洗澡时发现肿块表面破溃,才紧急送医检查。 经详细检查,王奶奶左乳肿块直径已超�

  • 乐道L90全国交付已开启一周:超一半车主直接上六座Ultra顶配

    上周,蔚来汽车旗下乐道L90上市并开启交付,租电价格17.98万元起,整车购买26.58万元起,乐道L90一上市就呈现出爆款态势。 蔚来李斌称,乐道L90短短三天时间累计交付量达1976辆, 跻身大型SUV销量周榜top3,仅次于问界M9,相比理想L9/L8两款车型同期销量叠加还多775台。 今日,乐道L90全国交付开启一周后,乐道汽车方面分享了首批车主们的选配情况。

  • 钛动科技亮相ChinaJoy2025,全球营销AI Agent赋能游戏出海新范式

    2025年ChinaJoy盛大开幕,铼动科技携全球首款营销AI+Agent产品Navos强势亮相。Navos通过AI技术覆盖营销全链路,提供出海营销解决方案。展会现场设置"星光奇遇展"和"出海加速站",展示智能营销云、创意生成引擎等创新产品。铼动还联合多家品牌推出互动打卡活动,吸引大量观众参与。线上直播同步进行,2.5小时获5.4万点赞。此次参展重点呈现AI赋能游戏出海的精细化、全球化服务能力,为行业带来"出海新曙光"。(140字)

  • 智能手表初代传奇落幕!苹果宣布Apple Watch Series 1将不再提供维修服务

    苹果公司近日宣布,Apple Watch Series 1正式走入历史,不再提供维修服务。 根据苹果的维修政策,产品停售后超过5年但未满7年会被归类为过时产品”,维修需视零件供应情况而定;停售后超过7年则为停产产品”,全面终止所有维修支持。 此次Apple Watch Series 1被降级为停产产品”,意味着未来官方将不再受理其维修服务。 值得注意的是,Apple Watch Series 1并非初代Apple Watch,而是

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

今日大家都在搜的词:

热文

  • 3 天
  • 7天