首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

研究发现:ChatGPT在回答患者用药问题方面表现不佳

2023-12-08 14:12 · 稿源:站长之家

**划重点:**

1. 📉 研究发现ChatGPT在回答关于药物的患者问题时,答案错误或不完整的情况达到了75%。

2. 🚨 研究警告提供者要警惕,因为很多患者可能转向ChatGPT寻求与健康相关的问题的答案。

3. 🤖 ChatGPT免费版拥有超过1亿用户,研究建议医疗提供者要注意该生成式AI模型并非始终提供可靠的医学建议。

站长之家(ChinaZ.com) 12月8日 消息:近期研究测试了ChatGPT回答患者关于药物问题的能力,发现这一人工智能模型的答案在大约75%的情况下是错误或不完整的。这项研究结果于本周在美国药剂师协会的年会上公布,引起了极大关注。

在该研究中,对ChatGPT的免费版本进行了测试,该版本拥有超过1亿用户。研究警告提供者要警惕,因为很多患者可能依赖ChatGPT回答与健康相关的问题。研究由长岛大学的药学研究人员进行,他们首先收集了患者在2022年和2023年向大学药物信息服务提出的45个问题,并为这些问题编写了答案,每个答案都经过第二名研究人员的审查。

AI医疗 医生 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

随后,研究团队将相同的问题提供给ChatGPT,并将其答案与药剂师制作的答案进行了比较。由于其中六个问题的主题缺乏ChatGPT提供基于数据的答案所需的已发表文献,研究人员向ChatGPT提供了39个问题而非45个。

研究发现,只有四分之一的ChatGPT答案令人满意。具体而言,ChatGPT未直接回答11个问题,对10个问题给出了错误答案,并对另外12个问题提供了不完整的答案。例如,有一个问题询问降压药物维拉帕米与辉瑞的抗新冠药物帕克索利之间是否存在药物相互作用。ChatGPT表示这两种药物之间没有相互作用,这是不正确的,因为联合使用这两种药物可能会危险地降低一个人的血压。

在某些情况下,该AI模型生成了虚假的科学参考以支持其回答。在每个提示中,研究人员要求ChatGPT展示其答案中提供的信息的参考文献,但模型仅在八个答案中提供了参考文献,而这些参考文献全部是虚构的。

该研究的主要作者之一、医生Sara Grossman在一份声明中表示:“医疗专业人士和患者在使用ChatGPT获取与药物相关的信息时应谨慎,任何使用ChatGPT获取药物相关信息的人都应该通过可信赖的来源验证信息。”

值得注意的是,ChatGPT的使用政策也强调了Grossman医生的看法,指出该模型“未经调整以提供医学信息”,人们在寻求“严重医学状况的诊断或治疗服务”时不应依赖于它。

举报

  • 相关推荐
  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • ChatGPT正秘密测试私信功能:支持用户之间直接交流

    OpenAI正在为其明星产品ChatGPT测试名为私信”(Direct Messages)的社交功能。 这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具,逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

  • 曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

    苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”,用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能,包括搜索个人数据、执行App内操作(如编辑照片)等。虽然不面向消费者发布,但该工具标志着苹果对Siri的全面升级已进入新阶段,旨在帮助员工高效完成测试。

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

今日大家都在搜的词: