研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分

2023-07-18 19:46 · 稿源：站长之家

站长之家(ChinaZ.com) 7月18日消息:根据《JMIR 医学教育》杂志上发表的一项新研究，ChatGPT 对与医疗保健相关的问题的回答很难与人类的回答区分开来。

医疗药科研

该研究由纽约大学的研究人员于今年 1 月进行，旨在评估使用 ChatGPT 或类似的大型语言模型来回答电子健康记录中提出的一长串问题的可行性。研究得出结论，使用像 ChatGPT 这样的大型语言模型可能是简化医疗保健提供者与患者沟通的有效方式。

为了进行这项研究，研究团队从纽约大学朗格医疗中心的电子健康记录中提取了患者的问题。然后，他们将这些问题输入 ChatGPT，并要求聊天机器人回答的字词与医疗保健提供者在电子健康记录中输入答案时的字词大致相同。

接下来，研究人员向近 400 名成年人展示了十组患者问题和回答。他们告知参与者其中五组回答是由人类医疗保健提供者撰写的，另外五组回答是由 ChatGPT 生成的。参与者被要求正确识别每个响应是由人类还是 ChatGPT 生成的，并获得经济奖励。

研究团队发现，人们准确区分聊天机器人和人类生成的答案的能力有限。平均而言，参与者正确辨别回答来源的能力约为 65%。这一结果与研究参与者的人口统计特征无关。

研究的作者表示，这项研究证明了 LLMs 在协助医患沟通方面的潜力，尤其是在行政任务和管理常见慢性疾病方面。

然而，他们指出，还需要进行进一步研究，以探索聊天机器人在承担临床职责方面的能力。研究团队还强调，提供者组织在策划 LLM 生成的建议时要谨慎，以充分考虑这些 AI 模型的限制和潜在偏见。

在进行研究时，研究人员还询问参与者对聊天机器人在回答不同类型问题上的信任程度，采用了一个从完全不可信任到完全可信任的 5 分制评分标准。他们发现，人们对于关于保险或预约安排等后勤问题的信任最高，对于关于诊断或治疗建议的问题，人们对聊天机器人生成的回答的信任最低。

这项纽约大学的研究并不是今年发表的唯一一项支持使用 LLMs 回答患者问题的研究。

今年 4 月，《JAMA 内科医学》发表的一项研究表明，LLMs 在减轻医生面对的海量电子邮件负担方面具有重要潜力。该研究评估了由医生和 ChatGPT 提供的两组对患者咨询的回答。一组由医疗保健专业人员组成的评审团确定，由于 AI 模型的回答更加详细和富有同理心，ChatGPT 的表现优于人类提供者。

（举报）

研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分

OpenAI创始人最新演讲：不要做套壳ChatGPT，建议多研究AI医疗和AI教育

荐库克证实苹果正在开发，类ChatGPT产品

OpenAI表示将继续免费提供ChatGPT，不追求快速盈利

荐淘宝，多了一个“ChatGPT”入口

研究揭示：ChatGPT不能让业余人员成为优秀的编程者

荐开了眼的ChatGPT真让人开了眼了

荐世界第一ERP厂商SAP，推出类ChatGPT产品—Joule

ChatGPT的“地下经济”，给AI行业带来了什么？

荐ChatGPT重磅升级：可以看图、听声音、说话啦！

融资1亿美元的类ChatGPT模型开源啦！可商用，8个模型

今日大家都在搜的词：

热文

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

马斯克个人财富达5000亿美元特斯拉市值飙升助力

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

罗永浩替小米说公道话：海报小字是行业陋习

iPhone调休闹钟上热搜苹果客服回应：需手动设置

雷军：小米17 Pro Max很多门店已经缺货

站长商机