GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了？

2023-11-21 17:34 · 稿源：站长之家

要点:
由马萨诸塞大学和复旦大学的研究团队开发的GPT-4V，在医学执照考试中的准确率超过大部分医学生，为人工智能在医学临床中的应用提供了理论基础。
尽管人工智能在医学影像诊断中取得长足进展，但医生难以在未经严格测试的情况下信任其诊断结果，因为理解人工智能的判别需要额外认知成本。
研究测试了GPT-4V在美国医学执照考试题上的能力，表现出高准确率。然而，其解释质量和可靠性仍需改进，以适应真实临床场景。

站长之家(ChinaZ.com) 11月21日消息:近期研究显示，GPT-4V在医学执照考试中表现优异，准确率远超过大部分医学生。这为AI在医学临床中的应用提供了新的可能性。尽管人工智能在医学影像诊断方面取得了显著进展，医生仍难以完全信任其诊断结果，需要额外的认知成本。

为了增强医生对人工智能的信任，研究团队建议通过医学执照考试来评估AI的专业知识和技能。研究还指出GPT-4V在解释质量方面存在局限性，强调了人机协作在未来医疗诊断中的重要性。

论文地址：https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3

AI医疗医生人工智能

图源备注：图片由AI生成，图片授权服务商Midjourney

该研究使用了涉及不同医学领域的带有图像的选择题来测试GPT-4V的性能，结果显示在美国医学执照考试等三个考试上，GPT-4V的准确率分别达到了86.2%、62.0%和73.1%。

尽管在解释正确时医疗专业人士对GPT-4V的解释较为认可，但当回答错误时，存在图像误解等问题。研究团队提出通过提示来改进GPT-4V的解释质量，展示了GPT-4V作为影像诊断辅助工具的潜力。然而，研究也指出GPT-4V仍需改进解释质量和可靠性，以适应真实临床场景。

综合而言，GPT-4V在医学执照考试中的表现为人工智能在医学领域取得了显著进展提供了证据。然而，要将其应用于真实临床环境，还需要进一步改进解释质量和可靠性。这一研究为未来开发更精细的人工智能协作系统提供了方向，以使其成为可靠的医学辅助工具。

（举报）

相关推荐

关键词：

GPT-4V

OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
双11洗衣机：海尔云溪4.0居行业销额TOP1

双十一期间，海尔云溪4.0洗衣机凭借AI直驱洁净科技和AI双擎热泵技术，精准解决顽固污渍难洗净、娇贵面料易损伤、烘干缠绕打结等用户痛点，实现15分钟洗净81种污渍、1.28超高洗净比及透干不伤衣效果，以技术升级推动行业从“洗净”向“洗好护好”转型，稳居行业销额榜首。

双十一家电竞争海尔洗衣机
Creators’ App迎来重大更新

索尼与分秒帧联合推出云端影像创作平台ICE-Cloud，集成索尼先进影像技术与高效云端协作能力，为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用，实现素材自动上传、云端管理、在线审片和项目协同，打破时空限制，提升创作效率。通过Creators’ App连接相机与云端，实现即拍即传、异地实时协作，致力于打造新一代创意工作流。

索尼云端影像创作平台 Creators’
小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

小米手表S4 eSIM版与S4 Sport版正式上线，用户连接小米手机后可通过中国移动“一号双终端”业务实现手表与手机共享号码的便捷通信。目前云南、四川两省暂未开放，其他地区用户可通过小米运动健康App在线自助办理。办理需确保手表与手机连接，并在手表设置中开启移动网络开关，待eSIM数据传输完成后即可使用全部功能。其他支持eSIM的小米手表产品也在逐步认证中，未来将陆续开放服务。

小米手表S4 eSIM功能中国移动
佳能R50V专为人像优化，轻巧便携且肤色还原自然，漫展外拍必备

佳能R50V半画幅相机以约6000元亲民价格，为年轻创作者、COS爱好者及国风Vlog玩家提供全能设备。机身仅323克轻巧便携，支持单手操作；配备“平滑皮肤模式”优化人像，双防抖提升手持拍摄稳定性。支持6K超采样4K视频录制，具备专业视频功能与智能对焦系统，满足漫展COS、国风创作等多场景需求，助力用户轻松产出专业级作品。

佳能R50V 半画幅相机轻巧机身
华为Mate 70 Air配置价格公布：可选CPU 售价4199起

华为Mate70 Air于11月6日10:08开启预售，提供麒麟9020B和9020A两款CPU版本，价格从4199元至5199元。机身仅6.6mm厚、208g重，配备7英寸OLED临境大屏，支持120Hz刷新率。影像系统包括后置四摄组合与前置1070万超广角镜头，内置6500mAh电池与66W快充。支持双向北斗卫星消息、Wi-Fi7，预装HarmonyOS 5.1系统。凭借轻薄设计、可选CPU及全面配置，有望引发市场关注。

华为Mate70Air 麒麟9020B 麒麟9020A
荣耀亲选LCHSE耳夹式耳机2 Pro开启预约：44小时超长续航！

在华为FreeClip 2耳夹耳机发布之后，荣耀亲选的第二代耳夹耳机也来了，目前已经开启预约。与华为策略相同，荣耀亲选LCHSE耳夹式耳机2 Pro的充电仓这次也采用了素皮材质。

荣耀耳机耳夹式耳机空间音频
专业创作者之选：佳能R50V在视频、Vlog与直播领域的全能表现

佳能R50V相机专为视频创作者设计，集专业视频制作、Vlog记录与高质量直播于一体。支持6K超采样4K视频录制，配备10-bit 4:2:2色彩与Canon Log3，保障画质细腻且后期空间大。机身仅323克，便携性强，优化自拍与竖拍操作，内置美颜与智能对焦功能。直播时可通过USB直连电脑，实现4K 60P高清输出。它融合专业性能与易用性，是应对多种创作需求的理想选择。

视频制作 Vlog记录高质量直播
真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

真我GT8 Pro阿斯顿马丁F1限量版于11月10日开售，售价5499元。配备16GB+1TB顶配内存，外观融入F1赛车元素，采用标志性青绿色和专属设计，包装盒含赛车主题配件。UI深度定制，拥有专属开机动画和相机水印。配置包括6.79英寸2K直屏、高通骁龙8至尊版平台、7000mAh电池，支持120W有线及50W无线闪充。影像系统搭载5000万像素主摄及2亿像素潜望长焦，支持多种胶片滤镜。具备满级防尘防水和超声波屏下指纹，综合性能强劲，专为科技与赛车爱好者打造跨界盛宴。

真我GT8Pro 阿斯顿马丁F1 限量版手机

今日大家都在搜的词：

热文

3 天
7天

GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了？

OpenAI发布GPT-5.1：情商大涨本周开始推送

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

双11洗衣机：海尔云溪4.0居行业销额TOP1

Creators’ App迎来重大更新

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

佳能R50V专为人像优化，轻巧便携且肤色还原自然，漫展外拍必备

华为Mate 70 Air配置价格公布：可选CPU 售价4199起

荣耀亲选LCHSE耳夹式耳机2 Pro开启预约：44小时超长续航！

专业创作者之选：佳能R50V在视频、Vlog与直播领域的全能表现

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

今日大家都在搜的词：

热文

iPhone Pocket正式开售：联名三宅一生售价1299元起

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

站长商机