首页 > 业界 > 关键词  > 机器学习最新资讯  > 正文

来自美国COVID-19数据集的机器学习模型已可预测疾病的严重程度

2021-07-14 08:10 · 稿源: cnbeta

今天发表的一篇新论文显示去年建立的一个集中的COVID-19健康记录库开始显示出成果。该资料库是迄今为止最大的一套COVID-19记录,由一个研究人员和数据专家团队在去年建立,以帮助理解COVID-19的严重程度。

这项研究发表在《美国医学会杂志网络版》上,研究了COVID-19严重病例的风险因素,并追踪了该疾病随时间推移的进展情况。作者建立了机器学习模型,根据在医院第一天收集的信息预测哪些住院病人会发展成严重疾病。

使用被称为国家COVID队列协作数据飞地,简称N3C的集中式数据库意味着研究团队能够将数十万病人的记录纳入其分析中。该研究使用了来自34个医疗中心的数据,包括100多万成年人--174568名COVID-19检测呈阳性的人和1133848名检测呈阴性的人,包括从2020年1月到2020年12月的记录。

该分析显示了在2020年期间COVID-19的治疗方法是如何变化的,因为医生尝试了新的治疗方法并获得了更多的经验。使用抗疟疾药物羟氯喹治疗的患者比例到2020年5月下降到几乎为零,这种药物在证明无效之前曾被前总统唐纳德·特朗普推广,随后在研究表明类固醇地塞米松可以提高生存率之后,6月份的使用量有所上升。

数据集还证实,在2020年期间,COVID-19患者的存活率有所提高。在3月和4月,入院的COVID-19患者中有16%死亡。在9月和10月,这一比例降至略低于9%。

当重症患者到达医院时,心率、呼吸率和体温较高的人更有可能需要强烈的干预措施,如通气措施,他们也更有可能死亡。白细胞计数、炎症、血液酸度和肾脏功能的异常也与更严重的病例有关。研究小组利用这些数据点和其他数据点建立了机器学习模型,可以预测哪些病人会得重病。作者写道,这些模型最终可以作为决策工具的基础,并进行额外的测试。

研究人员从该大流行病一开始就一直在分析COVID-19的发展轨迹。这项研究的优势在于从一个庞大而多样的数据集中提取--它不限于一家医院或一个州。在美国,研究人员通常仅限于研究他们工作的机构中的病人的医疗记录。这意味着他们能够纳入研究的记录数量可能是有限的,而且他们不能轻易检查他们的结论是否适用于其他地方。

像N3C这样的资源,汇集了几十个机构的记录,避开了这些限制。到目前为止,N3C包括来自73个卫生机构的数据,并有超过200万COVID-19患者的记录。200多个使用这些数据的研究项目正在进行中,包括研究COVID-19再感染的风险因素和该疾病对怀孕的影响。

但是它并不完美--将各医院的信息标准化是困难的,而且可能没有许多病人的完整数据。然而,拥有这样一个庞大的数据集是非常宝贵的。

阅读文献原文:

https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2781923?utm_source=For_The_Mediautm_medium=referralutm_campaign=ftm_linksutm_term=071321

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词: