首页 > 传媒 > 关键词  > 超级计算机最新资讯  > 正文

生物计算领域,为什么超算安腾比通用计算机算得还要快?

2024-04-09 17:00 · 稿源: 站长之家用户

一直以来,超 级计算机因其无可匹敌的运算实力而在科研界享有“巨擘”之称,大众耳熟能详的莫过于那些荣登全球超算Top500推荐榜的翘楚品牌,如Frontier和神威·太湖之光等,它们展现出了卓越的通用高性能计算能力。然而,在生物计算这一细分领域中,即便是这些巨头也会显得有些“力不从心”,难以全面应对诸如大规模分子动力学模拟、蛋白质三维结构预测等相当挑战性的任务。这时,就不得不提在生物计算领域占据显著地位的专用超 级计算机安腾(Anton)了。

安腾超 级计算机   图片来源:D.E. Shaw Research

安腾超 级计算机是由美国D. E. Shaw研究所于2007年首 次发布,专门用于对生命科学研究和生物制药研发领域至关重要的算法——分子动力学模拟算法的加速。在计算分子动力学模拟(Molecular Dynamics, 简称MD)问题时,超算安腾的计算效率比全球最 强的超算Frontier还要高上数十倍。

为什么安腾超 级计算机能比美国Frontier算得还要快?

秘诀就在于安腾超 级计算机的“专项定制”属性。安腾超 级计算机由大量的特定应用集成电路(ASIC)组成,通过一个专门的高速三维环形网络相互连接 。不同于通用超算的一刀切设计,超算安腾的架构专为细粒度事件驱动而设计运算,通过增加计算与通信的重叠来提高性能。

由于安腾超 级计算机主要专注于分子动力学模拟加速,即其所应对的主要任务属于通讯密集型的并行计算范畴。在此背景下,超算安腾在芯片设计、通信网络这两个方面进行了特殊设计,从而有效提升此类任务的计算效率。

512个深度定制ASIC芯片 提供强大算力支持

首先,在硬件层面,由于CPU、GPU等通用的算力芯片无法满足特定问题对算力性能的要求,因此,专用超 级计算机常常选择搭载ASIC芯片(即专用集成电路),以针对性地提供解决特定问题所需的强大算力支持。

安腾超 级计算机的核心优势就在于其使用的512个MD专用ASIC芯片。这些芯片经过深度定制,具有针对性强的指令集架构(ISA),能够比较准确执行分子动力学模拟(MD)中最耗时和最频繁的计算任务,如分子间的长程和短程相互作用力的计算,为这些关键计算步骤提供硬件算法层面的性能优化,例如快速傅里叶变换(FFT)等算法。

图片来源:D.E. Shaw Research

同时,为了减少计算延迟,安腾超 级计算机还设计高度专业化的专用硬件数据路径和控制逻辑,用于评估范围受限的相互作用,并执行电荷扩散与力插值。除了在芯片上密集整合高度定制化的计算逻辑之外,这些流水线还针对每个操作都采用了定制化精度。

“量体裁衣”般的并行计算硬件设计  只为提升计算性能

GPU、通用超算等通用的计算架构更多关注的是访存密集型任务的优化,而超算安腾则是针对通讯密集型的并行计算问题进行了特化优化。因此超算安腾在处理高度依赖大量通讯密集型并行计算的分子动力学计算任务时,自然就会比传统的通用超 级计算机架构多出许多天然的优势。

具体来说,超算安腾上运算的分子动力学算法的主要应用领域之一是对蛋白质进行的仿真模拟。这类仿真模拟任务需要计算机记录当前每个原子的位置、运动状态等,之后利用分子动力学模拟计算这些粒子之间相互影响的运算结果。在这样的情况下,每个节点需要承担的运算并不复杂,所以并不需要每个计算单元具有极其高强的计算能力;也不需要大规模数据的输入输出存,所以也不是访存密集型任务。因此在设计上,安腾超 级计算机取消了其它并行计算硬件中十分常见的缓存,也就是不需要很大的存储空间。

例如,对于一个包含25,000个粒子的MD模拟,其整体架构状态只需要1.6兆字节,放到一个由512个节点构成的系统中,每个节点仅占用3.2千字节。鉴于此特性,超算安腾选择在ASIC上仅仅配备SRAM和小型L1缓存,并确保在常规操作条件下,所有的代码和数据都能够妥帖地装载在芯片之上,没有把宝贵的硅片面积用于构建大型缓存或是复杂的内存层级结构,而是将这些资源重点投入到通信和计算性能的提升上。

此外,分子动力学模拟中,最为消耗计算资源的是分子间的长程相互作用力的计算,如静电相互作用等。据统计,在通用处理器上运行的标准MD模拟中,计算静电和范德华力所耗费的时间占到了总体计算时间的约90%。由于这些力的计算都是基于成熟的物理原理和公式得出的,不太可能随力场模型进化而发生巨大改变,基本因此非常适合硬件加速。但是,要想实现MD模拟的显著提速,光是加速这些“核心循环”还不够,还需要对其他相关的计算任务进行同步加速。依据阿姆达尔定律,即使把前述占用90%计算时间的任务的计算效率大幅优化,如果其余10%的计算任务还是维持现状的话,整个系统的最 大加速比也只能达到10倍左右的上限。因此,超算安腾特意划拨了相当一部分硅片面积用于加速那些诸如键力计算、约束条件计算、速度和位置更新等其他关键任务。

服务器摆放与网络结构的特殊设计 有效提升通讯效率

在通信层面,由于分子动力学模拟是一种需要大规模并行化的计算密集型方法,因此快速并行分子动力学模拟的实现就需要节点间通信的高带宽和低延迟。为提高通讯效率,安腾超 级计算机也做了一些特别的设计。

例如,整个超算安腾的服务器都被紧密地摆放在一个正方体的机箱中,这样的好处在于节点之间依靠网络互联,紧密排列使得网络的传输距离大大降低,可靠性和速度大大提升,所以速度有了很大的提升。

又比如,超算安腾设计了独特的内存子系统,专门用于积累每个粒子所受的力,这样可以减少计算过程中必要的数据交换。为了进一步提高计算效率,安腾超 级计算机采用了低延迟、高带宽的网络结构,不仅在单个ASIC芯片内部实现了快速通信,还在不同ASIC芯片之间也建立起了有效的互联网络。这个网络特别支持常见的MD通信模式,比如多播和稀疏数据结构的压缩传输,同时也支持协调式的“推送”式通信方式,即生产者主动将结果发送给消费者,无需消费者预先请求数据。此外,系统中还配备了一系列独立的直接内存访问(DMA)引擎,用于卸载计算单元的通信任务,使得通信和计算过程能更紧密地重叠执行,从而最 大程度减少等待时间。

ASIC芯片通过高速通道直接连接,形成三维环形拓扑结构

图片来源:D.E. Shaw Research

通过以上分析可见,安腾超 级计算机通过一系列精密的硬件和软件协同设计,聚焦于加速分子动力学模拟的关键环节,使得其在处理大规模生物分子系统长达百微秒级别的经典分子动力学模拟时表现出比较罕见的有效性。

安腾超 级计算机的技术路线无疑为我国超算领域、尤其是专用超算领域的技术研发提供了路线借鉴参考。在生物制药、生命科学、新能源新材料等前沿科技火热发展的重点垂直领域,我们应当加强全栈式的软硬件协同创新,挖掘在特定计算难题上的重大产业和创新机会,不断提升在全球超算竞赛中的竞争力与影响力。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 火山引擎AICC机密计算,助力蔚来智能时代数据安全

    文章探讨了智能汽车时代数据安全与隐私保护的挑战。蔚来汽车通过火山引擎Jeddak AICC机密计算平台,构建端云协同的安全防护体系,实现用户数据全链路保护。智能座舱从被动感知向主动认知升级,需要处理大量个性化数据,这对数据合规提出更高要求。面对全球化业务拓展中的合规效率问题,蔚来系统性构建技术驱动型数据安全合规框架,将隐私保护机制融入具体场景架构。专家指出,智能时代需要突破性隐私保护技术,行业需协同共建数据安全新防线。

  • 向“新”发力!itc保伦股份“分布式+AI边缘计算”赋能警务工作提升档升级

    ITC推出分布式综合管理平台V3.6,深度融合AI边缘计算技术,打造智慧警务指挥系统。该平台具备四大核心功能:1)支持50余种场景的实时监测与AI预警,准确率达95.3%;2)内置可视化编辑工具,实现数据快速分析呈现;3)采用深度学习技术,支持人脸识别、轨迹追踪等智能分析;4)创新拼墙信号管理,支持多业务协同。平台优势包括低延时(16ms)、超强FEC抗丢包(10%)、国密算法加密等,已成功应用于城市治安防控、应急指挥调度等场景,助力公安部门实现精准防控和快速响应。

  • 增量计算掀架构革命:云器定义新标准,Flink高成本遇挑战

    云器科技提出"通用增量计算"技术,解决大数据处理痛点。相比传统流计算框架Flink,该技术采用"按需增量"模式,仅计算数据变化部分,在保证分钟级时效的同时大幅降低资源消耗。云器还制定了行业首个增量计算标准SPOT,推动技术生态发展。该技术已在小红书等企业应用,实现流批一体化开发,支持标准SQL语法,开发效率提升显著。增量计算代表数据处理第四范式革命,为中小企业数字化转型提供新可能。

  • AI与量子科技融合浪潮来袭,英伟达/微美全息竞速抢抓量子计算战略机遇期

    湖南湘江新区正加速推动量子科技从实验室走向应用,量子产业初具规模。湖南长期深耕量子技术研发,推动量子科技实现从技术到产业的跨越。量子计算作为前沿技术,已在金融、医药等领域进入应用探索阶段。英伟达CEO黄仁勋预测量子计算将迎来拐点,未来几年可解决现实问题。微美全息等企业正构建量子计算生态,开发基于FPGA的数字量子协处理器,突破现有硬件局限。量子计算商用仍需10-20年发展,但已成为大国核心技术竞争领域,各国加大政策支持力度。量子科技发展将增强技术自主能力,是科技创新的重要里程碑。

  • 微云全息(NASDAQ: HOLO)引领车联网数据安全新纪元:创新分片技术重塑区块链存储与计算

    随着车联网(IoV)技术发展,数据安全问题日益凸显。区块链技术凭借去中心化、不可篡改特性,在解决车联网数据安全需求方面展现出巨大潜力。微云全息(NASDAQ: HOLO)针对区块链存储压力大和跨分片通信效率低两大挑战,创新性地提出内容分片和节点分片两种解决方案。内容分片通过智能合约将数据分类存储在不同节点,降低单节点存储压力;节点分片则将网络节点分组协作,减少跨分片通信次数。这两种方法有效提升了系统性能和可扩展性,为车联网数据安全提供了新思路。

  • 革新云计算资源管理:微云全息基于Quorum的区块链信任模型

    随着云计算发展,传统资源管理方式面临效率低、成本高、安全性不足等问题。微云全息基于Quorum区块链平台开发了新型身份管理模型,利用区块链的去中心化、不可篡改和透明特性,结合智能合约实现自动化身份验证、授权和计费。该方案通过分布式应用程序(DApp)提供用户界面,确保资源管理的安全高效。模型优化了传统云计算的资源分配方式,但仍需大规模性能测试。未来可结合5G、物联网等技术,为云计算资源管理带来革命性变革。

  • 蓝晶微生物与凯米拉达成战略合作:共推PHA 纸张涂层领域的规模化应用

    2025年6月16日,上海蓝晶微生物科技与全球造纸化学品领军企业凯米拉签署战略合作协议,共同推动聚羟基脂肪酸酯(PHA)在纸张、纸板等材料上的全生物基可降解涂层应用。PHA材料具有半年内自然降解为水和二氧化碳的环保特性,已通过多国食品接触认证。此次合作将加速传统造纸行业向"低碳+循环"模式转型,助力全球绿色包装产业发展。蓝晶微生物作为国内合成生物学领军企业,拥有自主知识产权的PHA生产技术,在产能和成本方面具备竞争优势。

  • 老板娘推客:集结中国老板娘力量,打造超级共选联盟

    深圳肆肆伍数字商务公司推出"老板娘推客"平台,由深耕街区的老板娘联盟创始人毛豆妈妈领航,八爪云公司提供技术支持。该平台整合全国2843个城市的老板娘资源,打造超级联盟网络。老板娘群体具备三大优势:1.自带消费信任背书;2.深厚人脉资源;3.天然销售天赋。平台通过IP驱动销售和推客平台创收双路径,助力老板娘实现个人IP打造和产品推广,形成"共选联盟"模式,成为全国好物互通的桥梁。旨在通过老板娘的影响力转化为实际销售力,共享资源与收益,共同书写商业新篇章。

  • 单场GMV破千万,超级头部达人在抖音找到变现新蓝海

    近来,超级头部达人(以下简称“超头”)正加速涌入本地生活赛道,寻求流量变现新蓝海。 @佛山电翰 凭借标志性的“拧螺丝”动作在抖音直播间掀起热潮,单场带动肯德基、塔斯汀等品牌交易额突破千万。 这并非个例,@梅尼耶 、@玲爷 、@密子君 等顶流达人近年也纷纷入局本地生活,开辟收入的第二增长曲线。 他们为何集体涌入?又将如何重塑行业格局?「克劳锐」深度�

  • 超级小爱支持一句话找小米YU7:再不用闪光、鸣笛了

    继小爱同学搭载在小米SU7上以来,无论是基础的车控功能,亦或是大模型加持下的车辆问答、互动畅聊与前车识别,都广受好评。 在小米YU7上,小爱同学再次进化,摇身一变超级小爱,为智能座舱带来了又一次创新变革。 依靠着多模态跨端能力,手机超级小爱支持一句话找小米YU7了。