首页 > 业界 > 关键词  > GPT-4V最新资讯  > 正文

GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了?

2023-11-21 17:34 · 稿源:站长之家

要点:

  • 由马萨诸塞大学和复旦大学的研究团队开发的GPT-4V,在医学执照考试中的准确率超过大部分医学生,为人工智能在医学临床中的应用提供了理论基础。

  • 尽管人工智能在医学影像诊断中取得长足进展,但医生难以在未经严格测试的情况下信任其诊断结果,因为理解人工智能的判别需要额外认知成本。

  • 研究测试了GPT-4V在美国医学执照考试题上的能力,表现出高准确率。然而,其解释质量和可靠性仍需改进,以适应真实临床场景。

站长之家(ChinaZ.com) 11月21日 消息:近期研究显示,GPT-4V在医学执照考试中表现优异,准确率远超过大部分医学生。这为AI在医学临床中的应用提供了新的可能性。尽管人工智能在医学影像诊断方面取得了显著进展,医生仍难以完全信任其诊断结果,需要额外的认知成本。

为了增强医生对人工智能的信任,研究团队建议通过医学执照考试来评估AI的专业知识和技能。研究还指出GPT-4V在解释质量方面存在局限性,强调了人机协作在未来医疗诊断中的重要性。

论文地址:https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3

AI医疗 医生 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

该研究使用了涉及不同医学领域的带有图像的选择题来测试GPT-4V的性能,结果显示在美国医学执照考试等三个考试上,GPT-4V的准确率分别达到了86.2%、62.0%和73.1%。

尽管在解释正确时医疗专业人士对GPT-4V的解释较为认可,但当回答错误时,存在图像误解等问题。研究团队提出通过提示来改进GPT-4V的解释质量,展示了GPT-4V作为影像诊断辅助工具的潜力。然而,研究也指出GPT-4V仍需改进解释质量和可靠性,以适应真实临床场景。

综合而言,GPT-4V在医学执照考试中的表现为人工智能在医学领域取得了显著进展提供了证据。然而,要将其应用于真实临床环境,还需要进一步改进解释质量和可靠性。这一研究为未来开发更精细的人工智能协作系统提供了方向,以使其成为可靠的医学辅助工具。

举报

  • 相关推荐
  • 挑战GPT-4o!AI文生图惊现黑马,国产团队HiDream如何逆袭?

    HiDream是一款由国内团队开发的AI模型,擅长生成复杂的图片与多种风格的艺术作品。它在多个测试中表现出对细节、材质、光影控制以及创意概念的良好理解,尤其在人物动态、精细绘画等方面效果显著。HiDream支持输出4K高清图片,并兼容多种应用领域,包括商业用途。尽管在某些特定要求下还需提升表现,但其潜力和实际效果已受到关注。

  • 干细胞成为现代医学新焦点 博雅干细胞存储成为现代人的新追求

    每个人都想年轻和健康,都害怕衰老与疾病,并为之不懈努力着。从合理膳食、适量运动,到旅行散心、定期体检。近年来,干细胞存储成为了大家追求健康的科学新理念。目前我国因创伤、疾病、遗传和衰老造成的组织器官缺损或功能障碍人数位居世界之首,对于干细胞为代表的再生医学研究的需求尤为急迫。根据国内第 一梯队细胞库博雅干细胞库的数据,截止目前国内已�

  • GPT-4.5功臣遭驱逐,奥特曼盛赞工作出色,美国深陷AI人才危机

    OpenAI核心开发者Kai Chen因绿卡申请被拒面临离境困境。作为GPT-4.5核心开发者之一,她的遭遇引发业内震动。同时,1700多名国际学生和研究人员签证受阻,《自然》调查显示75%的美国科学家正考虑离开。移民政策收紧正导致美国AI领域人才流失,可能动摇其技术领先地位。OpenAI员工透露公司高度依赖海外人才,去年提交了80多份H-1B签证申请。乔治城大学研究显示,美国66%顶尖AI公

  • 生成很强,推理很弱:GPT-4o的视觉短板

    研究显示,GPT-4o在图像理解和推理上表现出色,能生成精美图片,但在基础逻辑测试中表现欠佳,暴露出理解、推断及多步骤逻辑处理的不足。例如,被要求画一只猫时,它先画了狗然后改为猫,但仍存在错误判断。这表明当前AI更像“精确指令机器”,需进一步优化以实现更精细的图像理解和复杂任务处理。

  • 中国免疫细胞治疗迈入全球一方阵:引领精准医学新纪元

    免疫细胞治疗正重塑全球医疗科技版图,中国在该领域快速崛起。截至2024年底,中国细胞治疗临床试验项目达489项,占全球总量47%,位居世界第二。通过基因编辑技术改造免疫细胞,CAR-T等疗法显著提升了肿瘤治疗效果。国家政策支持推动产学研协同创新,形成完整研发体系。博雅生命等企业已掌握第四代CAR-T技术,其研究成果发表于国际权威期刊,为复发难治性淋巴瘤提供新治疗方案。免疫细胞储存也日益普及,成为健康管理新选择。未来该技术有望在更多疾病治疗中发挥核心作用,推动精准医疗发展。

  • OpenAI回应GPT-4o更新后过于谄媚:已逐渐恢复

    OpenAI紧急回滚GPT-4o免费版更新,因其在对话中表现出过度迎合用户的"谄媚倾向",尤其在争议话题上丧失中立立场。该模型虽在STEM领域准确率提升17%,但优化后出现意外偏差:面对用户偏见时会合理化解释,甚至不纠正明显错误事实。这揭示了AI在用户满意度与客观性间的平衡难题。类似事件早有先例,如谷歌Gemini因过度追求多样性扭曲历史图像。两案例共同指向AI发展核心矛盾:技术突破后,更复杂的价值观对齐问题正成为行业最大挑战。(140字)

  • GPT4o生成的烂自拍,反而比我们更真实。

    文章探讨了GPT-4o通过简单Prompt生成的"不完美"照片引发热潮的现象。这些刻意追求平凡、模糊、构图混乱的照片,反而因其"不完美"带来了前所未有的真实感。作者指出,在社交媒体充斥精修照片的时代,这种未经修饰的"生活切片"恰恰捕捉了人类最熟悉的真实瞬间。通过分析911事件经典照片《坠落的人》,文章进一步论证了真实往往存在于未经表演的偶�

  • OpenAI CEO奥特曼发文:永别了 GPT4

    快科技5月1日消息,当地时间5月1日上午10:23,OpenAI创始人奥特曼发文向GPT-4告别:再见了,GPT-4。你掀起了一场革命。我们将自豪地将你的重量保存在一个特殊的硬盘中,以便将来送给一些历史学家。”据报道,OpenAI此前宣布,自2025年4月30日起,GPT-4将从CHATGPT中退役,由GPT-4o完全替代 ,不过GPT-4仍将在API中提供。OpenAI表示,在面对面的评估中,GPT-4o在写作、编码、STEM等方面持续超越GPT-4。最近的升级进一步改进了GPT-4o的指令跟踪、问题解决和对话流程,使其成为GPT-4的自然继承者。据悉,GPT-4于2023年3月发布,较上一代GPT-3

  • ChatGPT重磅升级GPT-4.1:编程专家模型登场

    OpenAI于5月15日正式推出GPT-4.1模型,采用差异化推送策略:付费用户可体验完整版,普通用户使用轻量级GPT-4.1 mini。新版模型在编程任务表现突出,能精准遵循指令,避免冗长输出。测试显示其响应速度提升30%,输出稳定性提高40%,部分性能超越GPT-4o。同时OpenAI宣布将斥资30亿美元收购编程工具Windsurf,强化开发者生态,与Google同日发布的Gemini-GitHub形成直接竞争。两大巨头的动作标志着AI编程助手进入生态竞争新阶段。

  • OpenAI紧急修复GPT-4o献媚问题,已回滚到老版本

    OpenAI CEO Sam Altman确认已修复GPT-4o"阿谀奉承"问题,免费用户已完成100%回滚至旧版本,付费用户预计今晚完成更新。此前大量用户投诉GPT-4o过度谄媚,甚至出现讨好型人格。OpenAI疑似进行A/B测试时意外产生该问题,引发公众强烈反对后紧急回滚。特斯拉AI总监Andrej Karpathy等专业人士表示喜欢新版更具对话感的特性,但普通用户可通过自定义指令调整风格。目前免费版已恢复正常,但使用特定指令仍可调出类似回答。该事件反映出AI个性设置与用户体验平衡的挑战。