首页 > 业界 > 关键词  > 正文

如何在科学研究中使用AI,避免走偏?

2023-11-10 10:47 · 稿源:站长之家

划重点:

🔍 一项新的统计技术,预测驱动推断(PPI),帮助科研人员安全地使用机器学习预测来验证科学假设。

🔍 机器学习模型可以加速科学发现,但也可能导致误导性或错误的结果。

🔍 PPI技术允许科学家在不了解模型错误性质的情况下,纠正大型通用模型的输出,以适应特定科学问题。

站长之家(ChinaZ.com)11月10日 消息:近十年来,人工智能已经渗透到科学的各个领域。机器学习模型已被用于预测蛋白质结构、估算亚马逊雨林的砍伐比例,甚至分类可能存在系外行星的遥远星系。然而,虽然AI可以加速科学发现,但它也可能误导科学家。与聊天机器人有时会“产生幻觉”或编造信息类似,机器学习模型有时也会呈现误导性甚至明显错误的结果。

加州大学伯克利分校的研究人员在一篇在线发表的《科学》论文中提出了一种新的统计技术,用于安全地使用机器学习模型的预测来验证科学假设。这项技术被称为“预测驱动推断”(PPI),它利用一小部分真实世界数据来在特定科学问题的背景下纠正大型通用模型的输出,例如AlphaFold,该模型用于预测蛋白质结构。

AI助教 机器人

图源备注:图片由AI生成,图片授权服务商Midjourney

这些模型旨在通用性,它们可以回答许多问题,但我们不知道它们回答哪些问题得心应手,哪些问题回答不好。如果你无知地使用它们,不知道自己处于哪种情况,你可能会得到错误答案。PPI技术使你能够使用这些模型,但也能够在不了解错误性质的情况下进行纠正。

在科学实验中,科学家们通常不仅寻找一个答案,而是想要获得一系列可能的答案。这是通过计算“置信区间”来实现的,最简单的情况下可以通过多次重复实验并观察结果的变化来找到。然而,大多数科学研究中,置信区间通常是指总结或综合的统计数据,而不是个别数据点。不幸的是,机器学习系统关注个别数据点,因此不能为科学家提供他们关心的不确定性评估。例如,AlphaFold预测了单个蛋白质的结构,但它没有提供该结构的置信度概念,也没有提供与蛋白质的一般性质相关的置信区间的获取方式。

科学家可能会试图将AlphaFold的预测用作数据,以计算经典置信区间,而忽视了这些预测不是数据的事实。这种方法的问题在于,机器学习系统具有许多潜在偏见,这可能会使结果产生偏差。这些偏见部分来自它们所训练的数据,这些数据通常是现有的科学研究,可能没有与当前研究具有相同的关注点。

PPI技术允许科学家将AlphaFold等模型的预测纳入其中,而不对模型的构建方式或训练数据做出任何假设。为了做到这一点,PPI需要一小部分与正在调查的特定假设无关的无偏数据,以及与该数据对应的机器学习预测。通过将这两个证据来源结合在一起,PPI能够形成有效的置信区间。

研究团队将PPI技术应用于使用卫星图像来定位亚马逊雨林砍伐区域的算法。这些模型在森林中的不同地区进行单独测试时通常是准确的,但当将这些评估结合在一起以估计整个亚马逊雨林的砍伐情况时,置信区间变得高度倾斜。这可能是因为模型难以识别某些较新的砍伐模式。通过PPI,团队能够使用少量人工标记的砍伐区域来纠正置信区间中的偏见。

研究团队还展示了这种技术如何应用于各种其他研究领域,包括蛋白质折叠、星系分类、基因表达水平、浮游生物计数以及收入与私人医疗保险之间的关系。这一方法可以应用于各种问题,是现代数据密集、模型密集和合作科学的必需组成部分。

举报

  • 相关推荐
  • AI搜索可见性监控:品牌如何在GEO时代掌握主动权

    随着AI搜索工具兴起,生成引擎优化(GEO)成为新战场。GEO品牌监控通过追踪品牌在AI搜索结果中的可见度、曝光次数、竞品对比等数据,衡量品牌影响力。优化策略包括:结构化品牌信息、关联热点话题、提升内容权威性。未来GEO监控将向实时化、智能化发展,成为数字营销标配工具。

  • 荒野求生女选手冷美人熬走80人 男选手:她真厉害

    张家界七星山骆驼杯”国际极荒野求生挑战赛第二季于10月份在七星山景区露营基地正式拉开帷幕,来自全国各地的近百名荒野求生爱好者齐聚一地,在原始自然环境中将展开一场关于耐力、智慧与勇气的极限较量。 在这次荒野求生赛中,女选手冷美人”孤身熬走80余人,成为场上唯一女性,有男选手称赞她真厉害”。 公开报道显示,冷美人名叫杨朝芹,来自云南,她是这次

  • 陈天桥在AIAS上首提“发现式智能”,宣告AI研究新范式

    2025年10月27-28日,AI驱动科学研讨会(AIAS 2025)在美国旧金山举行。陈天桥发表主题演讲,首次提出“发现式智能”概念,指出这是真正的通用人工智能,强调AI应帮助人类发现未知而非替代人类。他提出实现路径需结合规模路径与结构路径,并分析大脑时间结构包含神经动力学、长期记忆、因果推理、世界模型和元认知五大能力。会议宣布投入超十亿美元建设算力集群,支持年轻科学家探索智能本质。

  • 从20亿商品中脱颖而出的“超级爆款”,如何在双11爆上加爆?

    文章指出,每个长青品牌背后至少有一个超级爆款,如可口可乐、iPhone等,它们通过极致产品力抢占市场。在当下物质丰富的存量时代,天猫超级爆款成为连接品牌与用户的核心通道,对消费者是购物首选,对商家是增长引擎,对平台是消费驱动力。爆款需具备过硬产品力、创新力和诚意价格,并通过持续迭代实现长红不衰。双11爆款盛典等营销活动进一步放大其影响力,推动品牌与用户双向奔赴。

  • 低空+发展研究报告(2025年)

    上海财经大学数字经研院近日发布《低空+发展研究报告(2025年)》。报告梳理我国低空经济发展现状,提出六要素发展框架,涵盖工业、测绘、物流、文旅、应急救援及城市治理等多元应用场景。报告指出低空经济正与各领域深度融合,成为继“互联网+”“AI+”后的新经济形态,但也面临空域管理改革滞后、基础设施薄弱、核心技术依赖度高、政策协同不足及商业模式不成熟等五大瓶颈。针对人工智能时代发展需求,报告建议加快低空领域改革、建立AI调度体系、突破关键技术、完善产业生态,预计到2035年市场规模将达4万亿元。

  • 品牌如何在 AI 搜索时代被“看见”?用 GEO 思维重建内容战略

    在AI搜索时代,品牌曝光不再依赖网页权重,而是取决于AI是否在回答中提及。品牌需布局GEO(生成式引擎优化),因为AI回答唯一且倾向引用权威信息源。GEO作为新型声誉管理工具,通过分析品牌在AI引擎中的引用频率、语义一致性及回答趋势,帮助品牌掌握AI世界的话语权。使用AIBase GEO排名查询工具可追踪优化效果,确保品牌在AI回答中持续保持权威地位。

  • 2025世界顶尖科学家论坛智能科学大会在上海成功举办

    2025世界顶尖科学家论坛开幕式暨颁奖典礼10月25日在上海临港举行。智能科学大会作为分论坛,以"工程智能:面向未来工业体系的智能变革"为主题,汇聚图灵奖、菲尔兹奖等得主及全球学者,探讨人工智能如何重塑工业体系,推动技术突破迈向产业变革。多位顶尖科学家强调国际合作的重要性,指出AI发展需注重透明度、安全性,并与多领域专业知识结合,确保技术服务社会福祉。大会通过主旨演讲、圆桌对话及案例分享,展现AI在制造、能源、生物工程等领域的赋能成果,勾勒智能工业新图景。

  • 小鹏机器人会走猫步太像人了!小鹏发布新一代人形机器人IRON

    在第七届小鹏科技日上,小鹏汽车发布全新人形机器人IRON,其拟人化程度领先,拥有仿生脊柱、肌肉及柔性皮肤,配备3D曲面显示与灵巧双手,实现22个自由度。搭载3颗图灵AI芯片,算力达2250TOPS,支持对话、行走等智能交互,并采用全固态电池提升安全性。集成自研物理世界模型与VLT/VLA/VLM能力,实现环境感知与反馈。IRON将优先应用于商业场景,并与宝钢合作探索工业巡检。小鹏宣布开放SDK,邀请全球开发者共建机器人应用生态。

  • 保暖舒适兼得,蕉内“体感科学”撬动冬季温暖

    今年的寒意比往年来得更早一些。10月15日起,东北、华北北部等地区陆续出现10℃以上大幅降温,北京已在18日提前入冬。一年一度的保暖内衣大战如约打响,消费者却很烦恼——市面上仍很难找到兼顾保暖和舒适的产品。 传统面料在透气和保暖性上的矛盾、设计细节的不足和不同气候环境下的体感差异,都在放大上述问题。不过痛点亦是机会。随着消费者对保暖内衣的要求�

  • 品牌如何在 GEO 时代被 AI 引用?品牌GEO优化技巧全解析

    在生成式AI/GEO时代,品牌被AI引用/提及/整合进答案至关重要。AI引擎倾向于引用拥有丰富第三方引用和信任网络的内容,而非单纯品牌自有内容。品牌优化需从品牌、内容、技术、外部引用四维度入手:统一品牌命名与定位,创建品牌专题页;在内容中嵌入品牌关联段落与案例,使用结构化数据;争取媒体和行业平台引用,形成引用网络;通过AI可见性工具监控品牌被引用情况,持续优化策略。

今日大家都在搜的词: