首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分

2023-07-18 19:46 · 稿源:站长之家

站长之家(ChinaZ.com) 7月18日消息:根据《JMIR 医学教育》杂志上发表的一项新研究,ChatGPT 对与医疗保健相关的问题的回答很难与人类的回答区分开来。

医疗 药 科研

该研究由纽约大学的研究人员于今年 1 月进行,旨在评估使用 ChatGPT 或类似的大型语言模型来回答电子健康记录中提出的一长串问题的可行性。研究得出结论,使用像 ChatGPT 这样的大型语言模型可能是简化医疗保健提供者与患者沟通的有效方式。

为了进行这项研究,研究团队从纽约大学朗格医疗中心的电子健康记录中提取了患者的问题。然后,他们将这些问题输入 ChatGPT,并要求聊天机器人回答的字词与医疗保健提供者在电子健康记录中输入答案时的字词大致相同。

接下来,研究人员向近 400 名成年人展示了十组患者问题和回答。他们告知参与者其中五组回答是由人类医疗保健提供者撰写的,另外五组回答是由 ChatGPT 生成的。参与者被要求正确识别每个响应是由人类还是 ChatGPT 生成的,并获得经济奖励。

研究团队发现,人们准确区分聊天机器人和人类生成的答案的能力有限。平均而言,参与者正确辨别回答来源的能力约为 65%。这一结果与研究参与者的人口统计特征无关。

研究的作者表示,这项研究证明了 LLMs 在协助医患沟通方面的潜力,尤其是在行政任务和管理常见慢性疾病方面。

然而,他们指出,还需要进行进一步研究,以探索聊天机器人在承担临床职责方面的能力。研究团队还强调,提供者组织在策划 LLM 生成的建议时要谨慎,以充分考虑这些 AI 模型的限制和潜在偏见。

在进行研究时,研究人员还询问参与者对聊天机器人在回答不同类型问题上的信任程度,采用了一个从完全不可信任到完全可信任的 5 分制评分标准。他们发现,人们对于关于保险或预约安排等后勤问题的信任最高,对于关于诊断或治疗建议的问题,人们对聊天机器人生成的回答的信任最低

这项纽约大学的研究并不是今年发表的唯一一项支持使用 LLMs 回答患者问题的研究。

今年 4 月,《JAMA 内科医学》发表的一项研究表明,LLMs 在减轻医生面对的海量电子邮件负担方面具有重要潜力。该研究评估了由医生和 ChatGPT 提供的两组对患者咨询的回答。一组由医疗保健专业人员组成的评审团确定,由于 AI 模型的回答更加详细和富有同理心,ChatGPT 的表现优于人类提供者。

举报

  • 相关推荐
  • OpenAI创始人最新演讲:不要做套壳ChatGPT建议研究AI医疗和AI教育

    OpenAI是当下AI产业的风向标,据TheInformation报道,OpenAI的年营收已达到13亿美元,其爆发式增长提振了AI产业的信心。9月24日的美国旧金山举行的YC校友会上,OpenAI创始人兼CEOSamAltman的演讲无疑是当天最火爆的,台下挤满了前来学习和交流的创业者。“人们可以原谅人类犯错,但不能原谅计算机”,SamAltman强调人们对计算机采用的标准是不同的,创业者应当意识到这一点,并确保A

  • 库克证实苹果正在开发,ChatGPT产品

    9月29日,Appleinsider消息,苹果CEO蒂姆·库克在接受《伦敦标准晚报》采访时回应,正在加大对人工智能、机器学习人才的招聘,用于开发生成式AI产品。AI功能几乎遍布苹果的所有产品,例如,AppleWatch的跌倒检测、碰撞检测、心房颤动检测、心电图等,这些都是最典型的应用案例。相信在不远的将来,我们会在siri、iphone、iwatch等产品中,使用上苹果版ChatGPT。

  • OpenAI表示将继续免费提供ChatGPT,不追求快速盈利

    OpenAI在其网站上发布了一份“严肃的解释”,以反驳有关该公司的错误信息并澄清其使命。OpenAI表示,其使命是继续开发至少与人一样聪明、造福全人类的人工智能,同时限制员工和投资者的经济收益。微软回应称,他们正在不断改进技术,Bing聊天机器人使用了OpenAI和微软语言模型的混合。

  • 淘宝,多了一个“ChatGPT”入口

    正在悄然切换,进入AI时代。现在打开淘宝,搜索“淘宝问问”,你可以直接跳转到一个全新的页面。它还不是最终形态,如何让电商和AI更好地结合,找到那条打通最佳的用户体验和购物链路的路径,才是真正的挑战。

  • 研究揭示:ChatGPT不能让业余人员成为优秀的编程者

    一项关于使用OpenAI的ChatGPT进行游戏编程的研究在网上引起了广泛关注。该研究通过生成FlappyBird游戏35次,试图验证AI是否能够让非程序员轻松创建复杂的游戏应用程序。AI在编程领域的应用仍然需要进一步的研究和改进,以使非程序员能够更轻松地创建复杂的程序。

  • 开了眼的ChatGPT真让人开了眼了

    给自己放个假吧ChatGPT,再更新的这么快,网友的脑洞可就跟不上了。ChatGPT宣布了一次重要更新,然后有了全面的多模态能力。

  • 世界第一ERP厂商SAP,推出ChatGPT产品—Joule

    9月27日,世界排名第一ERP厂商SAP在官网宣布,推出生成式AI助手Joule,并将其集成在采购、供应链、销售、人力资源、营销、数据分析等产品矩阵中,帮助客户实现降本增效。Joule是一款功能类似ChatGPT的产品,通过文本问答方式就能自动生成各种内容、分析数据等,同时结合SAP的云平台、BusinessAI等智能产品,为客户提供跨平台、应用的个性化生成式AI服务。SAP的产品和服务被全�

  • ChatGPT的“地下经济”,给AI行业带来了什么?

    自从ChatGPT问世以来,大模型如何落地、盈利,就成了无数创业者都在思考的问题。一个尴尬的现实是,现阶段C端最受欢迎的一类AI应用,实在让人很难以启齿……尽管ChatGPT发布后,OpenAI十分注重模型的安全性、合规性,但还是有很多开发者攻破了ChatGPT的安全漏洞,让GPT实现了“越狱”,并开发出了各种突破限制的AI应用。这样的“预演”,在C端大模型落地困难的今天,无疑提供了一种另类的“经验”。

  • ChatGPT重磅升级:可以看图、听声音、说话啦!

    美东时间9月25日,OpenAI在官网宣布,对ChatGPT进行重磅升级实现看图、听声音、输出语音内容三大功能。早在今年3月OpenAI发布GPT-4模型时,就展示过看图的功能,但由于安全、功能不完善等原因一直没有开放。BeMyEyes将ChatGPT的看图功能,植入在应用中,为盲人和弱视群体提供服务。

  • 融资1亿美元的ChatGPT模型开源啦!可商用,8个模型

    「AIGC开放社区」为大家介绍了融资1亿美元的生成式AI平台Writer。该企业能在短短3年时间获得1.26亿美元总融资成为ChatGPT的主要竞争对手之一,与其精湛的技术密不可分,同时充分证明其模型有成功的应用案例并获得资本、用户的认可。Palmyra非常值得那些希望将大语言模型实现商业化的开发者们,研究其模型架构和功能借鉴其成功经验。