来自美国COVID-19数据集的机器学习模型已可预测疾病的严重程度

2021-07-14 08:10 · 稿源： cnbeta

今天发表的一篇新论文显示去年建立的一个集中的COVID-19健康记录库开始显示出成果。该资料库是迄今为止最大的一套COVID-19记录，由一个研究人员和数据专家团队在去年建立，以帮助理解COVID-19的严重程度。

这项研究发表在《美国医学会杂志网络版》上，研究了COVID-19严重病例的风险因素，并追踪了该疾病随时间推移的进展情况。作者建立了机器学习模型，根据在医院第一天收集的信息预测哪些住院病人会发展成严重疾病。

使用被称为国家COVID队列协作数据飞地，简称N3C的集中式数据库意味着研究团队能够将数十万病人的记录纳入其分析中。该研究使用了来自34个医疗中心的数据，包括100多万成年人--174568名COVID-19检测呈阳性的人和1133848名检测呈阴性的人，包括从2020年1月到2020年12月的记录。

该分析显示了在2020年期间COVID-19的治疗方法是如何变化的，因为医生尝试了新的治疗方法并获得了更多的经验。使用抗疟疾药物羟氯喹治疗的患者比例到2020年5月下降到几乎为零，这种药物在证明无效之前曾被前总统唐纳德·特朗普推广，随后在研究表明类固醇地塞米松可以提高生存率之后，6月份的使用量有所上升。

数据集还证实，在2020年期间，COVID-19患者的存活率有所提高。在3月和4月，入院的COVID-19患者中有16%死亡。在9月和10月，这一比例降至略低于9%。

当重症患者到达医院时，心率、呼吸率和体温较高的人更有可能需要强烈的干预措施，如通气措施，他们也更有可能死亡。白细胞计数、炎症、血液酸度和肾脏功能的异常也与更严重的病例有关。研究小组利用这些数据点和其他数据点建立了机器学习模型，可以预测哪些病人会得重病。作者写道，这些模型最终可以作为决策工具的基础，并进行额外的测试。

研究人员从该大流行病一开始就一直在分析COVID-19的发展轨迹。这项研究的优势在于从一个庞大而多样的数据集中提取--它不限于一家医院或一个州。在美国，研究人员通常仅限于研究他们工作的机构中的病人的医疗记录。这意味着他们能够纳入研究的记录数量可能是有限的，而且他们不能轻易检查他们的结论是否适用于其他地方。

像N3C这样的资源，汇集了几十个机构的记录，避开了这些限制。到目前为止，N3C包括来自73个卫生机构的数据，并有超过200万COVID-19患者的记录。200多个使用这些数据的研究项目正在进行中，包括研究COVID-19再感染的风险因素和该疾病对怀孕的影响。

但是它并不完美--将各医院的信息标准化是困难的，而且可能没有许多病人的完整数据。然而，拥有这样一个庞大的数据集是非常宝贵的。

阅读文献原文：

https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2781923?utm_source=For_The_Mediautm_medium=referralutm_campaign=ftm_linksutm_term=071321

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
新机器学习框架DRAGIN:用于大语言模型中的动态检索增强，胜过传统方法

研究人员从清华大学和北京理工大学开发了DRAGIN，这是一种针对大型语言模型设计的动态检索增强生成框架。该框架旨在通过在文本生成过程中实时确定何时以及如何检索外部信息，从提高语言模型的性能。未来的工作旨在克服与自注意力可访问性相关的限制，并对查询构建技术的影响进行评估。

DRAGIN AI头条
苹果公司发布新型机器学习语言模型MLLLLM Ferret-UI 用于理解应用 UI 界面

苹果公司近日发布了一款名为MLLLLMFerret-UI的新型机器学习语言模型，旨在提升对移动应用用户界面的理解。这款模型经过特别优化，能够处理移动UI屏幕上的各种任务，并具备指向、定位和推理等能力。Ferret-UI还能够通过功能推断来解释屏幕的整体目的，显示出在理解和生成自然语言指令方面的高级能力。

模型 AI头条
Meta AI 发布开源基准数据集OpenEQA 促进AI代理的 “体验智能”

MetaAI研究人员今天发布了OpenEQA，这是一个新的开源基准数据集，旨在衡量人工智能系统对“体验式问答”的能力——这种能力使人工智能系统能够理解现实世界，从回答有关环境的自然语言问题。这一数据集被Meta定位为“体验智能”领域的关键基准，其中包含超过1，600个关于180多个真实环境的问题。为了衡量人工智能代理的性能，研究人员使用大型语言模型自动评分，衡量人工智能生成的答案与人类答案的相似程度。

Meta OpenEQA AI头条
70%金融机构采用人工智能和机器学习对抗欺诈

PYMNTS与人工智能领域的专家和创新者进行了座谈，探讨了该技术如何在未来几年改变支付和商业领域。众多意见和预测中，阿克里·阿德贾乌特，风险投资基金Exponion的创始人兼普通合伙人，表示金融机构在反洗钱和防欺诈工作中利用人工智能将受益匪浅。在未来几个月中，那些希望脱颖出的第三方欺诈预防供应商将是那些能够展示成功开发人工智能和机器学习技术的公司。

人工智能机器学习 AI头条
谷歌将推全新AI视频工具Google Vids 集多种功能一体

有消息称Google将推出一款集多种功能于一体的AI视频工具——GoogleVids。这款工具旨在帮助用户轻松创作故事板，并通过AI技术协助编辑内容，选择适合的场景、图片和音乐，自动生成一个完整的类似PPT的宣讲视频。GoogleVids将于6月份登陆GoogleWorkspace，届时用户将能够更加便捷地使用这一工具，为自己的工作和学习带来更多便利。

GoogleVids AI头条
谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别

在线文本识别模型取得了显著进展，但数学表达识别作为更为复杂的任务仍未得到足够关注。谷歌研究团队推出了MathWriting，一个专注于在线手写数学表达的数据集，包含230k人工编写和400k合成样本，超越了类似IM2LATEX-100K的离线HME数据集。未来的研究可以专注于优化训练/验证/测试分割以及开发针对数学表达的语言模型。

MathWriting 谷歌AI AI头条
荐AI日报：北大开源最强aiXcoder-7B代码大模型；OpenAI创始大神手搓千行C代码训练GPT；Stability AI图像模型竟能精细到这程度；在Vercel上一键部署Morphic

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

aiXcoder-7B
CTRL-F-VIDEO：允许用户在视频中搜索特定的单词或短语

在数字化时代，视频已成为人们获取信息的重要渠道。查找视频中特定内容的效率一直是一个挑战。虽然项目还处于初级阶段，偶尔可能会出现一些小问题，但它提供了一个创新的思路，为视频内容的搜索和管理开辟了新的可能性。

视频 AI头条
Cohere推出大模型Command R+ 优化高级检索增强生成功能

Cohere推出了专为企业级工作负载设计的大型语言模型CommandR，该模型优化了高级检索增强生成功能，以减少错误生成，并支持10种关键语言的多语言覆盖。地址:https://dashboard.cohere.com/CommandR引入了多步骤工具使用功能，允许模型在多个步骤中结合多种工具来完成困难的任务。CommandR首先在MicrosoftAzure上提供，未来也将在OracleCloudInfrastructure以及其他云平台上提供，以满足更广泛的用

Command AI头条
MiniGPT4-Video官网体验入口视频理解多模态AI大模型使用地址

MiniGPT4-Video是什么？MiniGPT4-Video是为视频理解设计的多模态大模型，能处理时态视觉数据和文本数据，配标题、宣传语，适用于视频问答。用户可以上传视频，让模型生成标题与宣传语，理解特效处理，或作超美抒情诗。

MiniGPT4-Video

今日大家都在搜的词：

热文

3 天
7天

来自美国COVID-19数据集的机器学习模型已可预测疾病的严重程度

今日大家都在搜的词：

热文

站长商机