首页 > 业界 > 关键词  > GPT-4V最新资讯  > 正文

GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了?

2023-11-21 17:34 · 稿源:站长之家

要点:

  • 由马萨诸塞大学和复旦大学的研究团队开发的GPT-4V,在医学执照考试中的准确率超过大部分医学生,为人工智能在医学临床中的应用提供了理论基础。

  • 尽管人工智能在医学影像诊断中取得长足进展,但医生难以在未经严格测试的情况下信任其诊断结果,因为理解人工智能的判别需要额外认知成本。

  • 研究测试了GPT-4V在美国医学执照考试题上的能力,表现出高准确率。然而,其解释质量和可靠性仍需改进,以适应真实临床场景。

站长之家(ChinaZ.com) 11月21日 消息:近期研究显示,GPT-4V在医学执照考试中表现优异,准确率远超过大部分医学生。这为AI在医学临床中的应用提供了新的可能性。尽管人工智能在医学影像诊断方面取得了显著进展,医生仍难以完全信任其诊断结果,需要额外的认知成本。

为了增强医生对人工智能的信任,研究团队建议通过医学执照考试来评估AI的专业知识和技能。研究还指出GPT-4V在解释质量方面存在局限性,强调了人机协作在未来医疗诊断中的重要性。

论文地址:https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3

AI医疗 医生 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

该研究使用了涉及不同医学领域的带有图像的选择题来测试GPT-4V的性能,结果显示在美国医学执照考试等三个考试上,GPT-4V的准确率分别达到了86.2%、62.0%和73.1%。

尽管在解释正确时医疗专业人士对GPT-4V的解释较为认可,但当回答错误时,存在图像误解等问题。研究团队提出通过提示来改进GPT-4V的解释质量,展示了GPT-4V作为影像诊断辅助工具的潜力。然而,研究也指出GPT-4V仍需改进解释质量和可靠性,以适应真实临床场景。

综合而言,GPT-4V在医学执照考试中的表现为人工智能在医学领域取得了显著进展提供了证据。然而,要将其应用于真实临床环境,还需要进一步改进解释质量和可靠性。这一研究为未来开发更精细的人工智能协作系统提供了方向,以使其成为可靠的医学辅助工具。

举报

  • 相关推荐
  • Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5

    国产开源大模型即将迎来新一波升级,除了万众期待的DeepSeek V4之外,月之暗面的Kimi也开始招募测试人员了,意味着很快也会上线。 根据Kimi的公告,他们即将开启Kimi新模型API内测计划,已完成「企业认证」的 Kimi 开放平台用户,均可申请。 前不久智谱、Minimax发布新一代模型之前都有招募测试的操作,而且内测没多久就开放了大模型的公开访问及API,随后又进一步开源给社�

  • 国产全球最强医疗大模型Baichuan-M3发布:已超越GPT-5.2与人类医生

    AI大模型今年会向更专业的方向发起猛攻,除了AI编程之外,AI医疗也成为一大重点,OpenAI刚收购了一个医疗初创公司,Cluade也推出了AI医疗助手。 今天还有一家国产大模型新品也将目光瞄准了医疗,那就是Baichuan-M3,这是知名大佬王小川投资成立的百川智能发布的AI医疗大模型,号称全球最强。 据百川智能介绍,Baichuan-M3 专为医疗场景深度优化,融合海量医学文献、临床指南�

  • 智谱的“GPT-4V”来了,CEO张鹏说他们就是奔着AGI去的

    时隔仅仅四个月,智谱大模型再度升级。在沈阳举办的2023中国计算机大会CNCC2023上,智谱介绍了新一代ChatGLM3大模型。主要是在在资源配置集中优化使用上需要跟各方进行协同,另外在比如算力网络、超算互联这样的新的解决方案领域,我们也还有很多研究工作需要推进。

  • 在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细

    最近一段时间,我们见证了大型语言模型的显著进步。生成式预训练Transformer或GPT的发布引领了业界和学术界的多项突破。更多技术细节和实验结果参阅原论文。

  • 直击新手痛点!佳能PowerShot V1评测:画质碾压手机、操作一键搞定

    佳能PowerShot V1定位为“新手Vlog神器”,兼顾专业画质与便携机身。它搭载约1.4英寸CMOS传感器,支持4K录制,画质超越手机。内置可调三档转速的冷却风扇,解决长时间拍摄过热问题。智能功能丰富,如“高级A+”模式可自动识别场景并调整参数,内置多种创意滤镜实现“滤镜直出”。机身小巧轻便,重量仅约426克,适合旅行携带。针对短视频带货场景,设有“特写演示用短片”模式,可智能切换商品与人物对焦。官方指导价具竞争力,结合优惠后实际入手价格在6000元以内,并常附赠Vlog套装等实用配件,为新手提供一站式创作解决方案。

  • 全新视觉提示方法SoM 让GPT-4V看的更准、分的更细

    研究人员推出了一种新的视觉提示方法Set-of-Mark,它可以让OpenAI多模态大模型GPT-4V在视觉内容理解方面有了质的提升。GPT-4V是一种基于GPT-4的多模态模型,可以同时处理文本和图像,并生成多种类型的输出。这些结果表明了SoM的有效性和灵活性,以及GPT-4V在细粒度视觉任务上的潜力。

  • 告别复杂后期,佳能PowerShot V1深度体验:一键出片的Vlog新选择

    佳能PowerShot V1是一款专为新手Vlog创作者设计的相机,精准定位“新手vlog神器”。它通过一体化专业设计和智能化功能,解决新手在画质、操作和直出效果上的痛点。相机搭载1.4英寸CMOS,支持5.7K超采样4K视频,画质优于手机;具备智能对焦、强悍防抖,确保画面清晰稳定;内置多种创意模式,如特写演示、美肤及丰富滤镜,实现一键出片,大幅降低创作难度。机身仅重426克,便携可靠,重新定义了入门即旗舰的Vlog体验。

  • 微软用GPT-4V解读长视频 MM-Vid能看懂电影还能讲给盲人听

    微软AzureAI发布了MM-Vid,这是一项结合GPT-4V与专用工具的创新,致力于解读长视频并为视障人士提供更好的体验。人工智能在长视频理解领域所面临的复杂挑战,包括分析多个片段、提取不同信息源、实时处理动态环境等。这一创新有望推动视觉领域的发展,使得语言模型在多模态环境下的应用更加广泛。

  • 微软开源多模态模型LLaVA-1.5媲美GPT-4V效果

    微软开源了多模态模型LLaVA-1.5,继承LLaVA架构并引入新特性。研究人员对其在视觉问答、自然语言处理、图像生成等进行了测试显示,LLaVA-1.5达到了开源模型中的最高水平,可媲美GPT-4V效果。LLaVA-1.5在多模态领域取得显著进展,通过开源促进了其在视觉问答、自然语言处理、图像生成等方面的广泛应用。

  • 浙大校友联手微软开源LLaVA-1.5,硬刚GPT-4V

    LLaVA-1.5是来自威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员近期开源的一款全新的端到端多模态大模型,可与OpenAI的GPT-4V形成正面竞争。LLaVA-1.5在11项基准测试中都实现了新的状态最优成绩,包括视觉问答、图像caption等任务,展现出了强大的多模态理解能力。LLaVA-1.5以其出色的多模态理解能力,向业内掀起了一股“硬刚GPT-4”的新风潮。

今日大家都在搜的词: