首页 > 业界 > 关键词  > 正文

如何在科学研究中使用AI,避免走偏?

2023-11-10 10:47 · 稿源:站长之家

划重点:

🔍 一项新的统计技术,预测驱动推断(PPI),帮助科研人员安全地使用机器学习预测来验证科学假设。

🔍 机器学习模型可以加速科学发现,但也可能导致误导性或错误的结果。

🔍 PPI技术允许科学家在不了解模型错误性质的情况下,纠正大型通用模型的输出,以适应特定科学问题。

站长之家(ChinaZ.com)11月10日 消息:近十年来,人工智能已经渗透到科学的各个领域。机器学习模型已被用于预测蛋白质结构、估算亚马逊雨林的砍伐比例,甚至分类可能存在系外行星的遥远星系。然而,虽然AI可以加速科学发现,但它也可能误导科学家。与聊天机器人有时会“产生幻觉”或编造信息类似,机器学习模型有时也会呈现误导性甚至明显错误的结果。

加州大学伯克利分校的研究人员在一篇在线发表的《科学》论文中提出了一种新的统计技术,用于安全地使用机器学习模型的预测来验证科学假设。这项技术被称为“预测驱动推断”(PPI),它利用一小部分真实世界数据来在特定科学问题的背景下纠正大型通用模型的输出,例如AlphaFold,该模型用于预测蛋白质结构。

AI助教 机器人

图源备注:图片由AI生成,图片授权服务商Midjourney

这些模型旨在通用性,它们可以回答许多问题,但我们不知道它们回答哪些问题得心应手,哪些问题回答不好。如果你无知地使用它们,不知道自己处于哪种情况,你可能会得到错误答案。PPI技术使你能够使用这些模型,但也能够在不了解错误性质的情况下进行纠正。

在科学实验中,科学家们通常不仅寻找一个答案,而是想要获得一系列可能的答案。这是通过计算“置信区间”来实现的,最简单的情况下可以通过多次重复实验并观察结果的变化来找到。然而,大多数科学研究中,置信区间通常是指总结或综合的统计数据,而不是个别数据点。不幸的是,机器学习系统关注个别数据点,因此不能为科学家提供他们关心的不确定性评估。例如,AlphaFold预测了单个蛋白质的结构,但它没有提供该结构的置信度概念,也没有提供与蛋白质的一般性质相关的置信区间的获取方式。

科学家可能会试图将AlphaFold的预测用作数据,以计算经典置信区间,而忽视了这些预测不是数据的事实。这种方法的问题在于,机器学习系统具有许多潜在偏见,这可能会使结果产生偏差。这些偏见部分来自它们所训练的数据,这些数据通常是现有的科学研究,可能没有与当前研究具有相同的关注点。

PPI技术允许科学家将AlphaFold等模型的预测纳入其中,而不对模型的构建方式或训练数据做出任何假设。为了做到这一点,PPI需要一小部分与正在调查的特定假设无关的无偏数据,以及与该数据对应的机器学习预测。通过将这两个证据来源结合在一起,PPI能够形成有效的置信区间。

研究团队将PPI技术应用于使用卫星图像来定位亚马逊雨林砍伐区域的算法。这些模型在森林中的不同地区进行单独测试时通常是准确的,但当将这些评估结合在一起以估计整个亚马逊雨林的砍伐情况时,置信区间变得高度倾斜。这可能是因为模型难以识别某些较新的砍伐模式。通过PPI,团队能够使用少量人工标记的砍伐区域来纠正置信区间中的偏见。

研究团队还展示了这种技术如何应用于各种其他研究领域,包括蛋白质折叠、星系分类、基因表达水平、浮游生物计数以及收入与私人医疗保险之间的关系。这一方法可以应用于各种问题,是现代数据密集、模型密集和合作科学的必需组成部分。

举报

  • 相关推荐
  • 天桥脑科学研究院举办AI驱动科学青年论坛 中国专家热议支持发现式智能新理念

    11月15日,天桥脑科学研究院与MiroMind在上海联合举办“AI驱动科学青年科学家论坛”。论坛聚焦“人类与AI的相互启迪与未来塑造”,汇聚脑科学、人工智能、医疗等领域学者。陈天桥提出的“发现式智能”理念引发热议,强调AI应主动构建可检验理论、提出可证伪假设,通过互动反思不断修正认知框架。与会专家探讨了借鉴大脑结构构建新AI模型的路径,认为人机协同将推动科学突破,AI的终极价值在于帮助人类探索未知。

  • 3亿人次围观“肝帝”造圆明园,接力挑战为何在抖音爆红?

    ​接力挑战的风,在抖音越刮越猛了。 今年8月,MC游戏圈开启了一场建筑生存接力挑战。本以为这会是一场主打休闲的友谊赛,结果网友们越看越不对劲。MC创作者们一个个仿佛肝王转世,秀出的作品一个比一个神仙。 所谓MC,指的是全球知名沙盒类电子游戏《我的世界》,因为游戏自由度极高,玩家可以在由方块构成的3D世界中自由探索、建造与冒险。 也因此,在这场建�

  • 再启微生态盛宴!第二届MGBC大会聚焦肠-X轴等核心领域,推动产学研协同

    2025年11月27日,MGBC2025大会在北京大学医学部成功召开。会议聚焦“人体微生态与健康”主题,围绕肠-X轴、代谢疾病、精神障碍、免疫系统等重点方向,通过主题报告、圆桌对话等形式,深入探讨前沿科学问题,分享最新研究成果与临床实践经验。大会启动了菌群精准移植平台与中华源菌库两大项目,旨在推动基础研究向临床转化,加速微生态健康产业发展。多位专家强调,揭示微生态奥秘是探索生命本质的基础科学前沿,也是通往精准医学与主动健康的关键路径,对推动“健康中国”战略落地具有重要意义。

  • DeepSeek创始人梁文锋入选《自然》年度十大科学人物

    《自然》杂志发布2025年度十大科学人物榜单,中国在人工智能与深海科学领域表现突出。深度求索创始人梁文锋及中科院深海科学家杜梦然入选。榜单特别指出,DeepSeek推出的R1大模型以开放权重形式发布,推动行业向更开放共享方向发展。该模型在多项能力上媲美顶尖模型,训练成本却远低于竞争对手。今年9月,梁文锋团队相关研究登上《自然》封面,回应了外界质疑,为行业树立了新标杆。

  • 净利润大涨233%,B站商业化走对了哪一步?

    “小破站”迈入稳健的盈利新周期。 美东时间,11月13日,哔哩哔哩(NASDAQ:BILI、HKEX:9626,以下简称“B站”)公布了截至9月30日2025年第三季度财报。 总的来看,这是一份利润、用户指标颇具亮

  • 宝宝转奶需科学过渡 妈咪爱加持肠道平稳少不适

    转奶是宝宝成长必经环节,但许多家长误以为仅指母乳转配方奶或跨品牌转换,实则同品牌不同段位更换同样需要科学过渡。由于婴幼儿消化系统未发育成熟,转奶不当易引发腹泻、过敏等不适。文章强调转奶需循序渐进,推荐新旧混合法(通用型)和隔顿转奶法(跨品牌适用),建议1-2周完成。转奶期间可补充益生菌调节肠道菌群,并避开生病、接种疫苗等时期。若持续出现严重不适需暂停并咨询医生。科学转奶配合肠道保护,能帮助宝宝平稳适应新食物。

  • 君乐宝携手调茶师研究院举办游学访厂活动共探行业发展新机遇

    8月12日至14日,君乐宝乳业集团与调茶师研究院联合举办“调茶师传承会品牌团”游学活动。活动期间,调茶师品牌创始人一行参观了君乐宝的牧场、科普馆、挤奶大厅及科研机构,深入了解其全产业链的精细化管理与匠心精神。双方还通过行业论坛探讨了茶饮与乳制品融合发展的新机遇,君乐宝分享了其在科研创新、奶源建设及产业合作等方面的综合实力,为茶饮行业提供了坚实的品质保障。未来,君乐宝将持续以专业态度推动行业健康发展。

  • 国有国宝,家有萌宝!健合Solid Gold素力高联名萌兰以科学营养养出高能萌主

    随着宠物经济精细化发展,宠物品牌Solid Gold素力高联合北京动物园大熊猫“萌兰”推出跨界联名,以“国有国宝,家有萌宝”为主题,通过线上线下互动传播科学养宠理念。品牌借助萌兰健康活力的形象,推广其高蛋白猫粮等产品,并打造系列限定周边,强化用户参与感。同时,品牌积极投身公益,关注流浪动物保护,致力于推动行业进步,共建人宠和谐未来。

  • 科杰科技入选赛迪AI Infra平台市场研究报告,引领Data&AI数据基础设施新范式

    近日,赛迪顾问发布《2025中国AI Infra平台市场研究报告》,全面梳理中国AI基础设施平台市场格局、技术趋势与竞争态势。报告显示,2024年中国AI Infra平台市场规模达345亿元,预计2025年将飙升至673亿元,同比增长95.1%。企业AI应用正从单点验证迈向嵌入核心业务流的深度阶段,对基础设施提出更高要求。科杰科技凭借Data&AI融合架构、湖仓一体引擎及企业级AI落地能力强势入选,位列“挑战者”象限,彰显其在Data&AI领域的领先地位。

  • 中航未来丨长三角低空经济研究院正式启动 打造低空经济创新示范高地

    近日,长三角(滁州)低空经济研究院在中航未来华东航空实训基地正式启动。该研究院由中科院航天信息研究院、滁州市政府等多方指导,联合长三角地区高校及企业共同发起,聚焦低空智联网核心技术,致力于突破无人机场景应用瓶颈。未来三年将重点建设低空智联网中心、开发智能无人机解决方案、建立人才培养基地,推动形成可复制的低空经济方案,目标在2028年前打�

今日大家都在搜的词: