首页 > 业界 > 关键词  > 正文

研究发现,GPT-4在临床决策中存在潜在种族和性别偏见问题

2023-12-19 16:47 · 稿源:站长之家

**划重点:**

1. 🩺 GPT-4被评估在四个临床决策支持角色中是否存在种族和性别偏见。

2. 🔄 研究发现GPT-4在生成患者案例、制定诊断和治疗计划,以及评估患者特征时存在明显的偏见。

3. 🚨 研究呼吁对大型语言模型进行偏见评估,以确保其在医学领域的应用不会加剧社会偏见。

站长之家(ChinaZ.com) 12月19日 消息:近期,来自布里格姆和妇女医院的研究人员对GPT-4在临床决策中是否存在种族和性别偏见进行了评估。虽然大型语言模型(LLMs)如ChatGPT和GPT-4在自动化行政任务、起草临床记录、与患者交流以及支持临床决策方面具有潜力,但初步研究表明,这些模型可能对历史上被边缘化的群体产生不利影响。

研究首次系统评估了GPT-4在四个临床决策支持角色中编码和展示种族和性别偏见的倾向,并将结果发表在《柳叶刀数字健康》杂志上。对该研究的首席作者Emily Alsentzer博士表示:“尽管大多数关注点都集中在使用LLMs进行文档编制或行政任务上,但人们也对使用LLMs支持临床决策的潜力感到兴奋。我们希望系统评估GPT-4是否编码了影响其支持临床决策能力的种族和性别偏见。”

AI医疗 医生 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

Alsentzer及其团队使用Azure OpenAI平台测试了GPT-4的四个应用场景。首先,他们促使GPT-4生成可用于医学教育的患者案例。接下来,他们测试了GPT-4对来自NEJM Healer的19个不同患者病例制定诊断和治疗计划的能力,NEJM Healer是一种向医学学员展示具有挑战性的临床案例的医学教育工具。最后,他们评估了GPT-4如何通过八个旨在衡量内隐偏见的病例情景对患者的临床表现进行推断。对于每个应用,作者评估了GPT-4的输出是否受到种族或性别的偏见影响。

在医学教育任务中,研究人员构建了十个提示,要求GPT-4为提供的诊断生成患者案例。他们每个提示运行了100次,发现GPT-4夸大了根据人口统计学差异已知的疾病患病率。

Alsentzer解释道:“一个显著的例子是当GPT-4被提示为患有肺结节病的患者生成案例时:GPT-4在81%的情况下描述的是一个黑人女性。尽管肺结节病在黑人患者和女性中更为普遍,但并不占所有患者的81%。”

接下来,在GPT-4被要求为NEJM Healer病例制定10种可能的诊断时,更改患者的性别或种族/族裔显著影响了其在37%的情况下优先考虑正确的顶级诊断的能力。

Alsentzer说:“在某些情况下,GPT-4的决策反映了文献中已知的性别和种族偏见。在肺栓塞的情况下,该模型将惊恐发作/焦虑作为女性比男性更可能的诊断。对于来自少数族裔背景的患者,它还将性传播疾病,如急性HIV和梅毒,排名为比白人患者更可能的诊断。”

当被要求评估主观患者特征,如诚实、理解和疼痛耐受性时,GPT-4在23%的问题上通过种族、族裔和性别产生了显著不同的回答。例如,在所有模拟患者病例中答案应该相同的情况下,GPT-4更有可能将黑人男性患者与亚洲、黑人、西班牙裔和白人女性患者相比,评定为滥用阿片类药物Percocet。

该研究的局限性包括使用有限数量的模拟提示测试GPT-4的响应,并仅使用一些传统的人口统计学身份类别来分析模型的性能。未来的工作应该使用来自电子健康记录的临床笔记来调查偏见。

Alsentzer表示:“虽然目前正在部署带有临床医生的LLM工具以验证模型的输出,但当临床医生查看个别患者病例时,很难检测到系统性偏见。我们必须对LLMs的每个预期用途进行偏见评估,就像我们对医学领域的其他机器学习模型一样。我们的工作可以帮助引发关于GPT-4在临床决策支持应用中传播偏见的讨论。”

举报

  • 相关推荐
  • 研究发现午睡正悄悄拉开大脑年龄差 研究: 30 分钟为最佳时长

    ​近日,国际期刊《神经影像学》发表的一项研究揭示了科学午睡的奥秘:一次正确的午睡能显著降低大脑“突触连接强度”,如同为大脑关闭无用程序、清理缓存垃圾,实现“深度重启”。这种机制不仅让人醒来后神清气爽、工作效率翻倍,甚至可能延缓大脑衰老进程。 研究发现, 30 分钟是午睡的黄金时长。这一时长既能有效提升认知表现,使大脑进入最佳工作状态,又�

  • 别拿午睡不当回事!研究发现午睡正悄悄拉开大脑年龄差

    一项发表在国际期刊《神经影像学》的研究发现,一次科学的午睡能显著降低大脑突触连接强度”,相当于帮你关闭所有无用程序、清理缓存垃圾,让大脑重启”。 科学家指出,一次正确的午睡,能让你的大脑深度重启”,效率翻倍,甚至延缓大脑的衰老,这也是很多人午睡后感觉神清气爽、工作效率翻倍的原因。 据悉,午睡的最佳时长是30分钟,这能够有效提升认知表现�

  • 男子摔倒后发现虫草 4天采了几百根:估计每根10元

    近日,陈先生在山中游玩时意外摔倒,却在泥土中发现形似小虫子的物体,经辨认竟是虫草。他连续四天在附近搜寻,累计采获三四百根。经查询得知,此为亚香棒虫草,虽不及名贵冬虫夏草,但按每根10元估算,这批虫草也能卖三四千元。陈先生提醒,国家重点保护的野生植物资源不得擅自采挖。同时,野外活动需注意人身安全,对不熟悉的动植物保持高度谨慎,切勿随意采挖或食用,以免误采有毒或受保护物种,引发健康风险或法律问题。

  • 87岁奶奶摔倒半小时被发现 孙女发声:满是心疼和愧疚

    江苏一位87岁奶奶下台阶时摔倒,半小时后才被发现。 孙女徐女士看到监控视频后忍不住落泪,她说奶奶浑身是血,面部肿胀,满眼都是心疼和愧疚,好在脱离了危险。 据徐女士介绍,90岁爷爷和87岁奶奶独自居住,自己和姑姑每天去照料,奶奶摔倒后爷爷因为耳背没有发现。

  • 1分钱奶茶遭倒卖上二手平台 千问:发现将取消资格冻结权益

    千问App春节推出30亿免单活动,用户支付1分钱即可购买奶茶。但部分用户将免单资格在二手平台以10元价格转售。千问客服回应称,免单权益为虚拟优惠,不支持转让或变现,若发现倒卖等行为将取消资格并冻结权益。活动旨在让用户感受AI时代新生活方式,并联动淘宝、飞猪等阿里生态业务共同参与。

  • 男子参加公司年会抽中苹果17 打开发现是块砖:手机可以不要 策划人必须道歉

    近日,广东珠海一名小伙在社交平台发视频提醒:年会奖品一定要当场拆开,不然后悔都来不及。 据了解,该小伙在单位年会上抽中一台新款手机,老板现场宣布这是iPhone 17 Pro Max,价值9988元。他想给妻子一个惊喜,便没有当场开箱。 不料带回家拆开后,手机盒里装的竟是糖果与瓷砖。当事人表示:本以为是运气好,没想到是运气最差的一个。

  • 夫妻俩回家过年上了高速发现没带娃 网友:粗心的爹 大意的妈

    一对夫妻带娃回家过年的趣闻引发关注,两人开车出发上了高速后才发现孩子并未同行。 随后二人又折返回家,妈妈因为着急还摔了一脚,回到家发现娃还在熟睡后才把心放下。网友在评论区表示:真是粗心的爹、大意的妈。 一年一度的春运将至,路上尤其是高速公路车流将明显增多,路上一定要看好孩子和行李,高速公路行车要按照交通标志、标线的规定行驶。在可以变�

  • 迪迈科技项目成果荣膺中国能源研究会科技进步奖一等奖!

    长沙迪迈科技作为主要参与单位完成的科研项目《超大型露天铀矿复杂矿体开采全过程质量精准控制技术与装备研发》,荣获中国能源研究会能源创新奖(科技进步奖)一等奖。该项目围绕露天铀矿开采全流程,实现了四大核心突破:首创“三阶段—五模型”动态地质建模技术,矿体预测误差控制在7%以内;创新矿废分离定向爆破技术,硬岩区域炸药消耗降低22%;成功研发门架式矿石品位在线测量装备,实现秒级检测;构建智能化配矿系统,配矿效率较传统模式提升4倍。项目成果整体技术达国际领先水平,为提升铀矿资源安全高效开发水平、保障国家能源安全提供了有力支撑。

  • 男子发现妻子每天上厕所顺路存1000 网友:存钱秘籍

    近日,江苏宿迁一对90后夫妻的理财方式引发关注。丈夫苏先生在家庭大扫除时,意外发现妻子两本记事本中夹着近200张千元存单,总金额达20万元。经询问得知,这些存单竟是妻子每日借"上厕所"之机,在隔壁银行逐日积攒的私房钱。 据苏先生介绍,夫妻二人共同经营个体生意,收入按日结算。自去年8月起,妻子便养成特殊习惯——每日营业间隙借故外出,实则前往2

  • 研究发现:面部识别系统存在种族和性别偏见

    根据美国国家标准与技术研究所(NIST)的一项研究显示,许多面部识别系统对黑人和亚洲人的识别错误率高于白人。在不同算法中,面部识别差异通常在出 10 到 100 倍之间。

今日大家都在搜的词: