首页 > 传媒 > 关键词  > 超级计算机最新资讯  > 正文

生物计算领域,为什么超算安腾比通用计算机算得还要快?

2024-04-09 17:00 · 稿源: 站长之家用户

一直以来,超 级计算机因其无可匹敌的运算实力而在科研界享有“巨擘”之称,大众耳熟能详的莫过于那些荣登全球超算Top500推荐榜的翘楚品牌,如Frontier和神威·太湖之光等,它们展现出了卓越的通用高性能计算能力。然而,在生物计算这一细分领域中,即便是这些巨头也会显得有些“力不从心”,难以全面应对诸如大规模分子动力学模拟、蛋白质三维结构预测等相当挑战性的任务。这时,就不得不提在生物计算领域占据显著地位的专用超 级计算机安腾(Anton)了。

安腾超 级计算机   图片来源:D.E. Shaw Research

安腾超 级计算机是由美国D. E. Shaw研究所于2007年首 次发布,专门用于对生命科学研究和生物制药研发领域至关重要的算法——分子动力学模拟算法的加速。在计算分子动力学模拟(Molecular Dynamics, 简称MD)问题时,超算安腾的计算效率比全球最 强的超算Frontier还要高上数十倍。

为什么安腾超 级计算机能比美国Frontier算得还要快?

秘诀就在于安腾超 级计算机的“专项定制”属性。安腾超 级计算机由大量的特定应用集成电路(ASIC)组成,通过一个专门的高速三维环形网络相互连接 。不同于通用超算的一刀切设计,超算安腾的架构专为细粒度事件驱动而设计运算,通过增加计算与通信的重叠来提高性能。

由于安腾超 级计算机主要专注于分子动力学模拟加速,即其所应对的主要任务属于通讯密集型的并行计算范畴。在此背景下,超算安腾在芯片设计、通信网络这两个方面进行了特殊设计,从而有效提升此类任务的计算效率。

512个深度定制ASIC芯片 提供强大算力支持

首先,在硬件层面,由于CPU、GPU等通用的算力芯片无法满足特定问题对算力性能的要求,因此,专用超 级计算机常常选择搭载ASIC芯片(即专用集成电路),以针对性地提供解决特定问题所需的强大算力支持。

安腾超 级计算机的核心优势就在于其使用的512个MD专用ASIC芯片。这些芯片经过深度定制,具有针对性强的指令集架构(ISA),能够比较准确执行分子动力学模拟(MD)中最耗时和最频繁的计算任务,如分子间的长程和短程相互作用力的计算,为这些关键计算步骤提供硬件算法层面的性能优化,例如快速傅里叶变换(FFT)等算法。

图片来源:D.E. Shaw Research

同时,为了减少计算延迟,安腾超 级计算机还设计高度专业化的专用硬件数据路径和控制逻辑,用于评估范围受限的相互作用,并执行电荷扩散与力插值。除了在芯片上密集整合高度定制化的计算逻辑之外,这些流水线还针对每个操作都采用了定制化精度。

“量体裁衣”般的并行计算硬件设计  只为提升计算性能

GPU、通用超算等通用的计算架构更多关注的是访存密集型任务的优化,而超算安腾则是针对通讯密集型的并行计算问题进行了特化优化。因此超算安腾在处理高度依赖大量通讯密集型并行计算的分子动力学计算任务时,自然就会比传统的通用超 级计算机架构多出许多天然的优势。

具体来说,超算安腾上运算的分子动力学算法的主要应用领域之一是对蛋白质进行的仿真模拟。这类仿真模拟任务需要计算机记录当前每个原子的位置、运动状态等,之后利用分子动力学模拟计算这些粒子之间相互影响的运算结果。在这样的情况下,每个节点需要承担的运算并不复杂,所以并不需要每个计算单元具有极其高强的计算能力;也不需要大规模数据的输入输出存,所以也不是访存密集型任务。因此在设计上,安腾超 级计算机取消了其它并行计算硬件中十分常见的缓存,也就是不需要很大的存储空间。

例如,对于一个包含25,000个粒子的MD模拟,其整体架构状态只需要1.6兆字节,放到一个由512个节点构成的系统中,每个节点仅占用3.2千字节。鉴于此特性,超算安腾选择在ASIC上仅仅配备SRAM和小型L1缓存,并确保在常规操作条件下,所有的代码和数据都能够妥帖地装载在芯片之上,没有把宝贵的硅片面积用于构建大型缓存或是复杂的内存层级结构,而是将这些资源重点投入到通信和计算性能的提升上。

此外,分子动力学模拟中,最为消耗计算资源的是分子间的长程相互作用力的计算,如静电相互作用等。据统计,在通用处理器上运行的标准MD模拟中,计算静电和范德华力所耗费的时间占到了总体计算时间的约90%。由于这些力的计算都是基于成熟的物理原理和公式得出的,不太可能随力场模型进化而发生巨大改变,基本因此非常适合硬件加速。但是,要想实现MD模拟的显著提速,光是加速这些“核心循环”还不够,还需要对其他相关的计算任务进行同步加速。依据阿姆达尔定律,即使把前述占用90%计算时间的任务的计算效率大幅优化,如果其余10%的计算任务还是维持现状的话,整个系统的最 大加速比也只能达到10倍左右的上限。因此,超算安腾特意划拨了相当一部分硅片面积用于加速那些诸如键力计算、约束条件计算、速度和位置更新等其他关键任务。

服务器摆放与网络结构的特殊设计 有效提升通讯效率

在通信层面,由于分子动力学模拟是一种需要大规模并行化的计算密集型方法,因此快速并行分子动力学模拟的实现就需要节点间通信的高带宽和低延迟。为提高通讯效率,安腾超 级计算机也做了一些特别的设计。

例如,整个超算安腾的服务器都被紧密地摆放在一个正方体的机箱中,这样的好处在于节点之间依靠网络互联,紧密排列使得网络的传输距离大大降低,可靠性和速度大大提升,所以速度有了很大的提升。

又比如,超算安腾设计了独特的内存子系统,专门用于积累每个粒子所受的力,这样可以减少计算过程中必要的数据交换。为了进一步提高计算效率,安腾超 级计算机采用了低延迟、高带宽的网络结构,不仅在单个ASIC芯片内部实现了快速通信,还在不同ASIC芯片之间也建立起了有效的互联网络。这个网络特别支持常见的MD通信模式,比如多播和稀疏数据结构的压缩传输,同时也支持协调式的“推送”式通信方式,即生产者主动将结果发送给消费者,无需消费者预先请求数据。此外,系统中还配备了一系列独立的直接内存访问(DMA)引擎,用于卸载计算单元的通信任务,使得通信和计算过程能更紧密地重叠执行,从而最 大程度减少等待时间。

ASIC芯片通过高速通道直接连接,形成三维环形拓扑结构

图片来源:D.E. Shaw Research

通过以上分析可见,安腾超 级计算机通过一系列精密的硬件和软件协同设计,聚焦于加速分子动力学模拟的关键环节,使得其在处理大规模生物分子系统长达百微秒级别的经典分子动力学模拟时表现出比较罕见的有效性。

安腾超 级计算机的技术路线无疑为我国超算领域、尤其是专用超算领域的技术研发提供了路线借鉴参考。在生物制药、生命科学、新能源新材料等前沿科技火热发展的重点垂直领域,我们应当加强全栈式的软硬件协同创新,挖掘在特定计算难题上的重大产业和创新机会,不断提升在全球超算竞赛中的竞争力与影响力。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 聚焦量子计算基础软件体系构建,量子计算开源技术分论坛即将启幕

    2025年11月22日,中国移动将在开放原子开发者大会期间举办量子计算开源技术分论坛。论坛聚焦量子计算基础软件体系构建与国内量子软件生态发展,探讨开源技术价值、标准化路径及降低开发门槛。亮点包括发布国内首款覆盖操作系统、开发框架、量子算法的全栈开源产品“五岳纪源”,旨在推动行业标准形成,实现软硬件协同。大会汇聚领先机构,围绕主流技术路线展开研讨,诚邀全球从业者共促开放共赢的量子产业新生态。

  • 微算法科技(NASDAQ MLGO):以隐私计算区块链筑牢多方安全计算(MPC)安全防线

    微算科技开发的隐私计算区块链将区块链技术融入多方安全计算(MPC),构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约,对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护,确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性,在金融、医疗、政务等领域实现跨主体数据安全协作,释放数据价值。

  • 聚焦学生营养痛点,君乐宝学生奶精准补充蛋白质及钙促成长

    随着健康中国战略推进,青少年营养健康成为国家关注重点。君乐宝乳业积极响应“学生奶计划”,以优质乳制品为核心,为青少年成长提供营养保障。当前我国学生营养状况面临挑战:超40%中小学生钙、维生素A摄入不足,城乡差异显著;超30%学生早餐质量不达标,高糖高盐零食消费攀升,导致隐性饥饿与超重肥胖并存。君乐宝通过全产业链管理和科技创新,持续优化学生奶配方,针对不同年龄段需求推出系列产品,有效改善关键营养素摄入不足现象。这一实践为乳企参与国民健康体系建设探索出新路径,期待更多企业共同构建青少年营养支持网络。

  • 拜耳×天鹜科技战略携手:AI蛋白质设计赋能健康消费品创新

    在人工智能重塑全球产业格局的背景下,拜耳健康消费品与天鹜科技于11月7日在进博会上签署战略合作协议。双方将深化AI技术在健康消费领域的科研探索、新品研发及应用转化,聚焦智能蛋白质设计、生物制造创新在消化和皮肤健康等领域的应用,共同推动人工智能在个性化健康管理和自我保健领域的发展,加速健康消费产业的智能化、精准化变革。

  • 微算法科技(NASDAQ MLGO)开发基于优先级的区块链交易打包算法,提高云边协同计算环境下的交易效率

    在云边协同环境中,区块链技术面临交易拥堵和确认延迟问题。微算法科技提出基于优先级的交易打包算法,通过评估交易类型、发起方信誉、数据大小及实时性需求,动态分配优先级。该算法优先处理高优先级交易,提升关键交易确认速度,优化资源分配,并强化信誉激励机制。应用场景包括工业物联网实时控制、金融支付及智能交通,显著提高系统效率和实时性,推动区块链在云边协同下的广泛应用。

  • 双11品质之选:前行者旗舰产品限时特惠,高性能外设入手正当时

    2025年双11期间,国产外设品牌前行者(EWEADN)凭借高性能产品与诚意优惠成为消费焦点。其明星产品X87S机械键盘支持三模连接、双8kHz回报率与12000mAh长续航,叠加补贴后到手价低至279元;S9大师版鼠标搭载快充芯片与旗舰传感器,满足电竞需求;DEEP80键盘以百元级价格实现0.08ms超低延迟。品牌在抖音、天猫、京东三大平台通过秒杀价、限时立减、满赠礼品等策略形成购买吸引力,多款键鼠产品斩获细分榜单TOP1。建议用户按场景选择:电竞玩家优选X87S+S9组合,办公学习可侧重DEEP80等高性价比产品,趁双11福利入手正当时。

  • 蚂蚁也正式加入AI超级入口战场,他的名字,叫灵光。

    蚂蚁集团推出全新AI助手“灵光”,以极致用户体验为核心突破传统AI工具。其亮点包括:结构化排版回答、交互式图表生成、3D模型渲染(如越王勾践剑动态演示),并支持闪应应用——用户可通过自然语言指令快速生成定制化小程序(如人生计时器、财报分析工具)。结合支付宝生态潜力,未来或实现真实账单管理与订阅优化。产品通过优雅设计唤醒用户探索欲,重新定义�

  • 阿里下场抢AI超级流量入口了

    在过去三年的全球AI军备赛中,阿里巴巴的主要精力放在面向B端的AI基建上,在To C的AI原生应用中,并没有投入过多精力。高盛也提出了“中国人工智能产业,AI基建看阿里,AI应用看腾讯”的观点。 然而,阿里巴巴不会轻易放过争夺下一代超级流量入口的机会,在2025年临近收官之际,向行业又投下一颗重磅炸弹。 在阿里启动“千问”项目的消息传出四天后,11月17日,阿里�

  • 荣耀500系列官宣:超级标准版+超级Pro版

    荣耀500系列新机正式发布,含标准版与Pro版两款。全系主打超薄机身设计,后置双摄,Pro版增加后置镜头至三摄横向排列。搭载骁龙8系芯片,支持长续航,游戏场景引入幻影引擎3.0提升性能。Pro版自带拍照按键,支持滑动与点按操作,便于快速抓拍与变焦。新机已获入网许可,预计本月正式上市,为消费者提供全系越级配置体验。

  • 制热强才是性能王!美的美家·全面风定义空调新标准

    美的推出2000元级全面风空调,10天预售狂销2万套,以"制热强"为核心突破行业痛点。产品搭载行业最大970cm²双风口和820m³/h循环风量,制热速度提升一倍,配合超广角送风实现全屋温差≤1℃。创新四件套将强风柔化为无扰气流,地暖模式模拟"暖从足起"体感。同时采用99.9%抗菌防霉滤网和56℃高温自洁技术,构建健康防护体系。该产品通过技术普惠战略,将旗舰级技术下放至主流市场,为陷入价格战的白电行业提供破局样本。

今日大家都在搜的词: