首页 > 传媒 > 关键词  > AlphaFold最新资讯  > 正文

突破AlphaFold3预测局限,超算安腾让科学家看到动起来的蛋白质

2024-06-13 13:40 · 稿源: 站长之家用户

2020年,谷歌旗下公司DeepMind发布了AlphaFold,实现通过靶点蛋白质的序列来预测三维静态结构,成功解决了生物学界50年的难题。今年5月,DeepMind发布了升级后的AlphaFold3,它能够以比较罕见的「原子精度」预测出所有生物分子的结构和相互作用,包括蛋白质、核酸(DNA/RNA)和更小分子的3D结构,并揭示它们如何组合在一起。AlphaFold3一经推出就登上Nature头版,掀起了AI学术圈的巨震。谷歌DeepMind联合创始人、CEO Demis Hassabis表示,AlphaFold3的发布是一个重要的里程碑,在AI理解和建模生物学的道路上,AI又迈出了重要一步!

对于药物研发而言,预测分子如何相互作用是一件非常重要的事情,因为大多数药物的作用原理是与目标蛋白质结合。通过AlphaFold的结构预测研究蛋白质与蛋白质(或其它分子)之间的相互作用,进而确认功能单位或者结构域,可以为遗传操作提供目标,为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子结构。因此,AlphaFold提供的结构预测能力兼具极大的学术和商业价值,受到了全世界研究者的瞩目。

AlphaFold的神经网络模型构架丨图片来源:DeepMind Blog

不过,AlphaFold3真的就是生物研究者和制药学家的美好解决方案了吗?很遗憾,答案是否定的,其中最关键的原因是,AI结构预测模型通常只能预测生物分子的静态3D结构,而不是溶液中生物分子系统的动态行为,这种限制在AlphaFold3中也仍然存在。这对于研究来说是一个巨大的局限,因为客观的真实世界是时刻动态变化的,预测静态3D结构意味着只能在一个复杂的运动过程中截取一个瞬间的片段切片,要想基于一个切片把完整的运动过程研究清楚,显然是不切实际的。

我国知名的结构生物学家、中科院院士颜宁曾在2022年的青年科学家50²论坛上分享她关于AI与结构生物学未来的看法。颜宁老师表示,虽然非常看好AI的未来,但现在来看它还是非常有局限性的,小分子是一个无穷的化学世界,想要去计算难度很大,短时间内并不看好AI可以真正取代实验技术。关于结构生物学未来,她认为,一是原位的结构生物学,即细胞内部时空分辨率的结构生物学,二是不同构象以及它们的变化的速度,如何去理解细胞里各个分子的动态变化,是目前面临一个比较大的挑战。“理解自然本身就是很美妙的事情。你不理解就寝食难安。如果看到它的不同的构象,就会发现新的药物靶点,就会理解一些突变是怎么样导致疾病的,而仅靠一个构象是没有办法呈现这些的”,颜宁老师称,自己最先进的职业目标就是从非常高的时空分辨率上理解细胞里小小分子世界。

颜宁老师提及的“时空分辨率”的关键所在,就是AlphaFold缺失的动态构象信息。AlphaFold就像是一个生物分子的3D摄影师,可以为研究者提供非常高清的生物分子结构预测的“照片”,但是,对于生物学家和制药学家来说,他们追求的是看到生物分子整个动态变化的“影片”。正如颜宁老师所说,很多时候单纯的“看到”就已经可以帮助到“理解”,显然,“看到”富含动态构象信息的分子“影片”将会比过去的静态“照片”更加提升科学家的“理解”水平。

那么,是否有办法能够补全AlphaFold在生物分子动态信息方面的短板呢?这就不得不提到计算生物学里面专门用于研究分子动态构象变化的分子动力学(Molecular Dynamics,简称MD)了。分子动力学是一种发展了几十年的计算机模拟实验方法,该技术不仅可以得到原子的动态运动轨迹,还可以观察到原子运动过程中各种微观细节。它是对理论计算和实验的有力补充,广泛应用于材料科学、生物物理和药物设计等。

只不过,由于使用分子动力学模拟构象态之间的过渡轨迹需要耗费巨大的计算成本,举例来说,人体内典型的大分子蛋白质往往由几十万到上百万个原子构成,假设我们用分子动力学模拟方法计算一个50万原子的蛋白质运动0.001秒的“影片”,哪怕用上1000颗主流CPU并行计算,都需要耗费超过100年的时间。这个巨大的限制让分子动力学的方法在过去一直都没法成为研究界的主流。

2013年,分子动力学在计算效率方面的窘境终于迎来了突破的转机。这一年,美国D. E. Shaw研究所发布了分子动力学专用比较优秀计算机安腾的第二代,它的算力的效率可以轻松达到传统超算的100-10000倍,在超算安腾的支持下,科学家能够以天为单位轻松完成微秒级的蛋白质动态仿真计算,甚至可以直接看到毫秒级蛋白质运动的动态“影片”。超算安腾一经发布就引起全世界范围内的关注,在往后的几年里,通过超算安腾发表在Cell、Nature、Science等顶刊的论文数量都达到了几十篇,可以说,超算安腾几乎凭借一己之力让美国生物计算领域的发展领先了世界十年以上。

D. E. Shaw研究所的单一兵博士等曾在2020年发表文章,描述了通过比较优秀计算机安腾看到的“动起来的蛋白质”的画面:利用超算安腾的超长时间模拟,观察到结合在蛋白表面的成药小分子,从一个结合口袋逐步“爬行”到另一个结合口袋,在此过程中蛋白构象发生变化,其隐匿口袋打开。类似这样的研究成果在过去是不可想象的,并且它具有能够颠覆传统生物制药研究范式的重大意义。

目前,有部分科学家已经开始展望将AlphaFold3这样的AI静态构象预测工具,与分子动力学这样的动态构象模拟计算工具相结合的应用场景。

首先,由于分子动力学模拟计算的参数输入需要的正好就是蛋白质的静态构象文件(PDB文件等),因此通过AlphaFold3预测出来的大量蛋白质静态结构正好可以作为分子动力学模拟计算的输入,通过AlphaFold3+分子动力学模拟的组合拳,科学家和制药学家可以针对想要研究的生物现象或潜在的成药靶点和成药分子,在AI模型里面进行自由的探索和批量的预测,随后针对其中有价值的预测成果,再通过长时间的分子动力学模拟来补充更多的动态构象信息,来帮助发掘更多有价值的成果,最后再通过实验进行比较准确的验证。可以预见到,这样的全新研究范式将会极大加速相关研究和药物研发的效率和精度。AlphaFold3的预测本来就不需要耗费很长时间,而类似超算安腾这样的高性能超算又让过去动辄耗时数周数月的分子动力学模拟的部分变成了几小时就可以完成的工作量,如此一来,这样的研究模式让很多研究者都看到了极大的潜力。

更进一步的,由于AI需要大量的数据进行模型训练,而过去能够获取的生物分子结构数据几乎都是依靠冷冻电镜等显微镜获取的静态构象,因此诸如AlphaFold这样的AI模型也只能依靠静态构象数据的训练得到静态构象的预测能力。试想如果能够给AI提供大量基于分子动力学模拟得到的生物分子动态构象数据来训练,是否就有机会在未来的AlphaFold4/5/6代实现动态构象数据的AI预测能力了呢?届时,AlphaFold应该就可以真正升级为AlphaDynamics,到那时,颜宁老师关于从非常高的时空分辨率上观测微观世界的目标可能就真的彻底被有效率地实现了。

不过,上述很多的构想,都需要依托于超算安腾对于分子动力学模拟计算的加速能力,否则,构想中的研究方法依然是需要耗费大量时间算力的“昂贵品”。可惜的是,目前世界上仅有的几台超算安腾都被安置在匹兹堡超算中心和位于纽约市的D. E. Shaw研究所中,并且其上机时间会严格根据提交给美国国家科学院独立专家委员会的研究提案分配,只接受美国学术机构的使用申请,严格禁止中国等其他国家科学家使用。因此,对于世界上绝大多数科学家来说,分子动力学模拟算力依旧是极其稀缺的研究资源,要想像超算安腾那样实现超高速大体系长时间的分子动态模拟,就只能依靠在传统超算中心上付出数十倍于超算安腾的计算时间和成本。

对于我国来说,超高性能的分子动力学算力将会成为决定生命科学和生物制药这样高精尖领域竞争的基石。凭借超算安腾的垄断算力,美国一家曾经默默无闻的AI制药公司Relay Therapeutics,仅用18个月、不到1亿美金,就确认了一款用于治疗胆管癌的高选择性FGFR2抑制剂药物RLY-4008的结构,这样的研发效率打破了多年来“新药研发费用超10亿美元,研发周期超10年”的双十魔咒,震惊了世界,也让Realy在医药圈一战成名。如果再叠加AlphaFold的数据库,药物研发的效率很可能会进一步大幅提升。

英伟达CEO黄仁勋曾惊叹,“未来生命科学会像传统行业那样高度工程化。当数据科学、人工智能和自动化的结合时,生物学会呈指数级改进,从而成为下一个黄金赛道。” 在这条黄金赛道上,我们必然不能缺席,并且高性能的超算很可能会成为赛道准入的重要入场门票之一。

当然,我们国家目前已经是世界公认的超算大国,在先进的通用超算竞争领域,已经有“太湖之光”“海洋之光”等足以媲美世界比较强性能的国产超算不断在诞生和迭代超越。不过,在超算安腾制霸的分子动力学专用超算领域,目前似乎还没有效率足够匹敌的方案出现,我们希望在不久的将来也能拥有追赶和媲美超算安腾的、属于我们自己的超高性能的专用领域超算。

免责声明:本站刊登/转载此文仅出于传递更多信息之目的,不等于赞同其观点或论证其描述,不负责其真实性或有效性,相关图文版权归原作者所有。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • GPTsWorks:第三方GPTs商店,聊天搜索GPTs。

    GPTs Works 是一个第三方GPTs商店,提供用户通过聊天的方式搜索和发现各种GPTs。该平台汇集了大量优秀的GPTs资源,用户可以通过提交链接或直接与平台交互来获取所需信息。平台的主要优点包括丰富的GPTs资源、便捷的搜索方式以及高效的信息获取能力。

  • ChartFast:AI数据分析师,秒速生成复杂图表。

    ChartFast是一个AI数据分析师工具,旨在简化您的数据可视化和分析任务。它自动化了重复且耗时的数据工作,让您能够快速生成精确而时尚的图表。

  • String Theories:探索和理解弦理论的交互式平台

    String Theories 是一个致力于教育和普及弦理论的交互式网站。它通过可视化工具和模拟,帮助用户理解复杂的物理概念,如弦、膜以及它们在宇宙学中的应用。该平台由物理学家和教育者共同开发,旨在提高公众对现代物理学前沿理论的认识。

  • Studymap.ai:个性化学习计划生成器

    Studymap.ai 是一个利用人工智能技术帮助用户生成个性化学习计划的在线平台。用户可以通过上传YouTube视频链接或文章,平台将基于这些内容生成具有结构化的章节、在线资源和项目想法的完整课程。它还提供进度跟踪功能,帮助用户更有效地学习。

  • ResumaidPro:定制化简历构建工具,AI辅助,提升求职效率。

    ResumaidPro是一款利用人工智能技术帮助求职者快速定制化简历的在线工具。它通过浏览器插件形式,允许用户在浏览器标签页内直接定制简历,优化简历内容以通过自动应聘筛选系统(ATS)。它使得简历定制化变得简单快捷,节省了求职者宝贵的时间,同时提高了求职成功的几率。产品背景是通过利用技术改善简历编写过程,以适应快速变化的就业市场。产品提供了不同套餐,包括按月或按季度计费,并且提供了免费试用。

  • CheckVisaSlots:实时监测美国签证预约空位

    CheckVisaSlots是一个专注于帮助学生和旅行者监测美国签证预约空位的在线服务。它通过提供实时的签证预约信息,帮助用户及时了解签证预约的可用情况,从而更好地规划他们的签证申请流程。该服务特别适合那些需要及时获取签证信息以安排旅行或教育计划的用户。

  • 星界AI:一站式AI图文创作神器

    星界AI是一款集成了多种AI大模型的图文创作神器,包括ChatGPT、谷歌Gemini、百度文心一言等,提供文案创作、知识问答、教育辅导、灵感启发等功能,以提高工作效率和创造力。

  • 神笔AIPPT系统:一键生成海量模板,支持SaaS多开的全开源系统

    神笔AIPPT系统是一款支持一键生成和海量模板的在线建站工具,采用SaaS模式,允许无限多开。该系统基于thinkphp 6.1 + mysql 5.7 + vue3 + vite5技术栈开发,完全开源,支持定制二次开发,适用于需要快速搭建个性化网站的用户。产品原价2888元,提供详细的安装部署文档和参数配置文档,以及使用过程中的免费指导服务。

  • Vozo:AI视频生成器,一键重写和配音视频。

    Vozo是一个AI视频生成器,它允许用户通过AI提示重写视频脚本、自动配音和唇形同步,从而快速生成新的视频内容。它支持将视频翻译成多种语言,并且可以针对不同的受众群体定制视频内容。Vozo的主要优点包括易用性、高效性以及能够保持原有视频的魅力。

  • 扣子专业版:企业级 AI 开发平台,无需编程技能,快速搭建个性化应用。

    扣子专业版是一款企业级 AI 应用开发平台,旨在帮助用户快速、低门槛地构建个性化的 AI 应用,支持无编程技能的用户使用。该平台拥有 1 万 + 插件的丰富生态,能够构建功能强大的大模型应用,同时支持数据私有化及团队协作,适合各类企业需求。定价灵活,能够满足不同规模的企业使用需求,是推动企业数字化转型的重要工具。

  • Gobi:个性化情绪健康指导APP

    Gobi是一款致力于提供个性化情绪健康指导的应用程序。它由一群对AI充满热情的团队开发,团队成员来自Google、Microsoft、Meta和Scale AI等知名公司。Gobi通过实时生成基于科学的语音指导健康实践,帮助用户管理情绪健康。产品的主要优点包括全天候的人性化健康支持、适应性AI个性化、实时健康实践生成、日常检查和情绪健康跟踪等。

  • DiT-MoE:大规模参数扩散变换器模型

    DiT-MoE是一个使用PyTorch实现的扩散变换器模型,能够扩展到160亿参数,与密集网络竞争的同时展现出高度优化的推理能力。它代表了深度学习领域在处理大规模数据集时的前沿技术,具有重要的研究和应用价值。

  • Picogen AI Image API:AI图像生成API,提供高质量的4K图像生成和编辑功能。

    Picogen AI Image API是一个领先的AI图像生成平台,提供与Midjourney, Stable Diffusion和DALL-E相媲美的高质量图像生成服务。它支持生成高达4K分辨率的图像,并且具备图像合并、背景移除和8K分辨率的图像放大等高级功能。Picogen旨在为数字营销人员、平面设计师、内容创作者等专业人士提供强大的视觉内容创作工具。

  • Colocio AI:一站式在线营销工具,由AI驱动,简化广告和内容创作。

    Colocio AI是一款集成了人工智能技术的在线营销工具,旨在帮助用户创建、评估和自动化在线广告活动。它通过AI技术生成高转化率的广告文案和社交媒体内容,提供无障碍的内容调度功能,以及实时的AI辅助和数据驱动的报告,帮助用户优化广告活动,提高性能。Colocio AI的背景是简化内容和媒体创作流程,专注于为品牌和目标受众量身定制内容,同时释放用户时间,让他们专注于战略规划和与受众互动,推动业务创新和增长。

  • Supermemory.ai:你的个人数字第二大脑

    Supermemory是一个致力于帮助用户组织、搜索和利用保存信息的平台。它提供强大的工具,如搜索引擎、写作助手和画布,旨在成为用户的个人第二大脑。它注重隐私保护,可在任何地方工作,支持自托管,并且价格亲民,提供免费层级。

  • Dialed:个性化AI激励演讲,激发潜能。

    Dialed是一款AI驱动的应用程序,旨在通过个性化的激励演讲来激发用户的潜能。无论是健身、演讲还是日常挑战,Dialed都能提供个性化的激励和启发。产品的主要优点包括个性化的激励演讲、真诚的支持、传奇的演讲定制、多种声音选择、背景音乐以及AI生成的激励图像。此外,Dialed还允许用户将激励演讲分享给朋友和家人。

  • Aphrodite-engine:PygmalionAI的大规模推理引擎

    Aphrodite是PygmalionAI的官方后端引擎,旨在为PygmalionAI网站提供推理端点,并允许以极快的速度为大量用户提供Pygmalion模型服务。Aphrodite利用vLLM的分页注意力技术,实现了连续批处理、高效的键值管理、优化的CUDA内核等特性,支持多种量化方案,以提高推理性能。

  • ICSFSurvey:深入研究大型语言模型的内部一致性和自我反馈

    ICSFSurvey是一个关于大型语言模型内部一致性和自我反馈的调查研究。它提供了对LLMs自我评估和自我更新机制的统一视角,包括理论框架、系统分类、评估方法、未来研究方向等。

  • Stable Audio Open demo:从文本提示生成立体声音频

    Stable Audio Open 是一个能够从文本提示生成长达47秒的立体声音频的技术。它包含三个主要组件:一个将波形压缩到可管理序列长度的自编码器、一个基于T5的文本嵌入用于文本条件、以及一个在自编码器的潜在空间中操作的基于变换的扩散(DiT)模型。该技术在生成音频方面表现出色,能够根据文本提示生成各种类型的音频,如打击乐、电子音乐、自然声音等。

  • Claude Engineer:利用Anthropic的Claude模型辅助软件开发任务的高级命令行界面。

    Claude Engineer是一个高级的命令行界面,它利用Anthropic的Claude 3和Claude 3.5模型的能力,来协助完成广泛的软件开发任务。这个工具无缝地结合了最先进大型语言模型的能力与实用的文件系统操作、网页搜索功能、智能代码分析和执行能力。

今日大家都在搜的词: