生物计算领域，为什么超算安腾比通用计算机算得还要快？

2024-04-09 17:00 · 稿源：站长之家用户

一直以来，超级计算机因其无可匹敌的运算实力而在科研界享有“巨擘”之称，大众耳熟能详的莫过于那些荣登全球超算Top500推荐榜的翘楚品牌，如Frontier和神威·太湖之光等，它们展现出了卓越的通用高性能计算能力。然而，在生物计算这一细分领域中，即便是这些巨头也会显得有些“力不从心”，难以全面应对诸如大规模分子动力学模拟、蛋白质三维结构预测等相当挑战性的任务。这时，就不得不提在生物计算领域占据显著地位的专用超级计算机安腾（Anton）了。

安腾超级计算机图片来源:D.E. Shaw Research

安腾超级计算机是由美国D. E. Shaw研究所于2007年首次发布，专门用于对生命科学研究和生物制药研发领域至关重要的算法——分子动力学模拟算法的加速。在计算分子动力学模拟（Molecular Dynamics，简称MD）问题时，超算安腾的计算效率比全球最强的超算Frontier还要高上数十倍。

为什么安腾超级计算机能比美国Frontier算得还要快?

秘诀就在于安腾超级计算机的“专项定制”属性。安腾超级计算机由大量的特定应用集成电路（ASIC）组成，通过一个专门的高速三维环形网络相互连接。不同于通用超算的一刀切设计，超算安腾的架构专为细粒度事件驱动而设计运算，通过增加计算与通信的重叠来提高性能。

由于安腾超级计算机主要专注于分子动力学模拟加速，即其所应对的主要任务属于通讯密集型的并行计算范畴。在此背景下，超算安腾在芯片设计、通信网络这两个方面进行了特殊设计，从而有效提升此类任务的计算效率。

512个深度定制ASIC芯片提供强大算力支持

首先，在硬件层面，由于CPU、GPU等通用的算力芯片无法满足特定问题对算力性能的要求，因此，专用超级计算机常常选择搭载ASIC芯片（即专用集成电路），以针对性地提供解决特定问题所需的强大算力支持。

安腾超级计算机的核心优势就在于其使用的512个MD专用ASIC芯片。这些芯片经过深度定制，具有针对性强的指令集架构（ISA），能够比较准确执行分子动力学模拟(MD)中最耗时和最频繁的计算任务，如分子间的长程和短程相互作用力的计算，为这些关键计算步骤提供硬件算法层面的性能优化，例如快速傅里叶变换(FFT)等算法。

图片来源:D.E. Shaw Research

同时，为了减少计算延迟，安腾超级计算机还设计高度专业化的专用硬件数据路径和控制逻辑，用于评估范围受限的相互作用，并执行电荷扩散与力插值。除了在芯片上密集整合高度定制化的计算逻辑之外，这些流水线还针对每个操作都采用了定制化精度。

“量体裁衣”般的并行计算硬件设计只为提升计算性能

GPU、通用超算等通用的计算架构更多关注的是访存密集型任务的优化，而超算安腾则是针对通讯密集型的并行计算问题进行了特化优化。因此超算安腾在处理高度依赖大量通讯密集型并行计算的分子动力学计算任务时，自然就会比传统的通用超级计算机架构多出许多天然的优势。

具体来说，超算安腾上运算的分子动力学算法的主要应用领域之一是对蛋白质进行的仿真模拟。这类仿真模拟任务需要计算机记录当前每个原子的位置、运动状态等，之后利用分子动力学模拟计算这些粒子之间相互影响的运算结果。在这样的情况下，每个节点需要承担的运算并不复杂，所以并不需要每个计算单元具有极其高强的计算能力;也不需要大规模数据的输入输出存，所以也不是访存密集型任务。因此在设计上，安腾超级计算机取消了其它并行计算硬件中十分常见的缓存，也就是不需要很大的存储空间。

例如，对于一个包含25，000个粒子的MD模拟，其整体架构状态只需要1.6兆字节，放到一个由512个节点构成的系统中，每个节点仅占用3.2千字节。鉴于此特性，超算安腾选择在ASIC上仅仅配备SRAM和小型L1缓存，并确保在常规操作条件下，所有的代码和数据都能够妥帖地装载在芯片之上，没有把宝贵的硅片面积用于构建大型缓存或是复杂的内存层级结构，而是将这些资源重点投入到通信和计算性能的提升上。

此外，分子动力学模拟中，最为消耗计算资源的是分子间的长程相互作用力的计算，如静电相互作用等。据统计，在通用处理器上运行的标准MD模拟中，计算静电和范德华力所耗费的时间占到了总体计算时间的约90%。由于这些力的计算都是基于成熟的物理原理和公式得出的，不太可能随力场模型进化而发生巨大改变，基本因此非常适合硬件加速。但是，要想实现MD模拟的显著提速，光是加速这些“核心循环”还不够，还需要对其他相关的计算任务进行同步加速。依据阿姆达尔定律，即使把前述占用90%计算时间的任务的计算效率大幅优化，如果其余10%的计算任务还是维持现状的话，整个系统的最大加速比也只能达到10倍左右的上限。因此，超算安腾特意划拨了相当一部分硅片面积用于加速那些诸如键力计算、约束条件计算、速度和位置更新等其他关键任务。

服务器摆放与网络结构的特殊设计有效提升通讯效率

在通信层面，由于分子动力学模拟是一种需要大规模并行化的计算密集型方法，因此快速并行分子动力学模拟的实现就需要节点间通信的高带宽和低延迟。为提高通讯效率，安腾超级计算机也做了一些特别的设计。

例如，整个超算安腾的服务器都被紧密地摆放在一个正方体的机箱中，这样的好处在于节点之间依靠网络互联，紧密排列使得网络的传输距离大大降低，可靠性和速度大大提升，所以速度有了很大的提升。

又比如，超算安腾设计了独特的内存子系统，专门用于积累每个粒子所受的力，这样可以减少计算过程中必要的数据交换。为了进一步提高计算效率，安腾超级计算机采用了低延迟、高带宽的网络结构，不仅在单个ASIC芯片内部实现了快速通信，还在不同ASIC芯片之间也建立起了有效的互联网络。这个网络特别支持常见的MD通信模式，比如多播和稀疏数据结构的压缩传输，同时也支持协调式的“推送”式通信方式，即生产者主动将结果发送给消费者，无需消费者预先请求数据。此外，系统中还配备了一系列独立的直接内存访问（DMA）引擎，用于卸载计算单元的通信任务，使得通信和计算过程能更紧密地重叠执行，从而最大程度减少等待时间。

ASIC芯片通过高速通道直接连接，形成三维环形拓扑结构

图片来源:D.E. Shaw Research

通过以上分析可见，安腾超级计算机通过一系列精密的硬件和软件协同设计，聚焦于加速分子动力学模拟的关键环节，使得其在处理大规模生物分子系统长达百微秒级别的经典分子动力学模拟时表现出比较罕见的有效性。

安腾超级计算机的技术路线无疑为我国超算领域、尤其是专用超算领域的技术研发提供了路线借鉴参考。在生物制药、生命科学、新能源新材料等前沿科技火热发展的重点垂直领域，我们应当加强全栈式的软硬件协同创新，挖掘在特定计算难题上的重大产业和创新机会，不断提升在全球超算竞赛中的竞争力与影响力。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐微软、OpenAI投资1000亿美元，打造“Stargate”超级计算机

3月30日，著名科技媒体theinformation独家消息，微软、OpenAI正在开发一个数据中心项目，包含一台名为“Stargate”超级计算机将配备数百万个AI专用芯片，主要为OpenAI的研发、产品提供服务。据一位曾与OpenAI联合创始人兼首席执行官SamAltman交谈过，以及查看过微软对该项目的成本估算内部人士透露，该成本的总投资高达1000亿美元。AI算力已经和数据一样成为生成式AI领域的水、电、

OpenAI
中国第三代自主超导量子计算机 “本源悟空”入驻国家超算互联网

中国第三代自主超导量子计算机本源悟空”，日前正式入驻国家超算互联网平台。国家超算互联网是由国家有关部委支持和指导的，集超算算力、网络、服务、资源共享于一体的综合性平台。这是中国自主量子算力首次大规模、稳定向全球提供算力服务，标志中国进入量子算力可用时代。

量子计算超导量子计算机本源量子云服务
Extropic 发布一种全新的热力学计算机利用物质的自然波动作为计算资源

Extropic团队开发了一种全新的硬件平台，这一平台利用物质的自然波动，特别是热力学和量子物理中的随机波动，作为计算资源。这种计算方式与传统的基于硅的数字计算机有本质的不同，为生成式人工智能应用提供了更高效的支持。团队由物理学和AI领域的专家组成，致力于将物理学和AI统一起来。

Extropic
广州东华职业学院领导受聘担任广东省计算机用户协会顾问

广州东华职业学院副校长温志宏受邀参加广东省计算机用户协会举办的顾问、副会长证书颁发及战略合作伙伴签约仪式，并被正式聘为协会顾问。“广东省计算机用户协会成立于1993年，经广东省民政厅注册，由科教、生产、经营、技术服务等领域的代表组成，是兼具专业性、行业性、自律性和公益性，具有独立法人地位的省一级社团组织。我们也期待通过多方的努力，开创校�

广州东华职业学院广东省计算机用户协会温志宏
2024 QS排名发布：计算机MIT霸榜，清华11，北大15

2024QS世界大学学科排名出炉了!在计算机科学专业排名中，MIT、卡内基梅隆大学、斯坦福大学占领了世界前三席，中国大陆有8所高校进入百强，清华大学排名最高，并列第11。2024QS世界大学学科排名来了!总体和23年变化不大。国际研究网络国际研究网络指数反映了院校通过与其他高等教育机构建立可持续的研究合作关系，使其国际研究网络地域多样化的能力。

2024QS世界大学学科排名计算机科学高校排名
比利时计算机视觉初创公司RoboVision获4200万美元融资

站长之家（ChinaZ.com）4月9日消息:比利时计算机视觉初创公司RoboVision最近宣布成功获得4200万美元的融资，这笔资金将用于推进其AI-enabled视觉平台在全球范围内的发展和拓展。这轮A轮融资由Target Global、Astanor Ventures和Red River West领投，使RoboVision的总融资额达到6500万美元。RoboVision的首席执行官Thomas Van den Driessche表示，公司将利用这笔投资加强全球业务，并“进一步巩固我们在AI�

RoboVision
AI「搅动」云计算，阿里云推动算力底层变革

“从‘敢为行业先’的可持续低价到AI生态的全面构建，阿里云正面向未来的企业及开发者，全力铺设推动社会进步的算力基石”。在阿里云近期发布的品牌宣传片中，分众传媒和百川智能分别现身其中。作为云计算产业的领航者，阿里云也将继续以造浪者的身份，打造新一代算力基础设施，真正推动“智能化”惠泽千行百业、千家万户。
腾讯会议发布极速版 AI小助手可计算会议垃圾时长占比

腾讯会议发布了极速版，新增了三项功能以提升开会效率。首先是支持一键闭麦功能，参会人员可以点击“提效”来匿名提醒发言人闭麦，如果多人反复点击“提效”，系统会逐步降低发言人音量直至闭麦，减少低效发言，提升会议效率。最后是会议信用分机制，根据用户身份、预约历史、发言内容、议程效率等五大维度赋分，用户可以在每场会议后给对方打分，不同分数享有不同发言时长和发起会议权限。

腾讯会议会议效率 AI
国家超算互联网平台正式上线！意义远不止让全国超算联网

在今天的首届超算互联网峰会上，国家超算互联网平台正式上线，成为支撑数字中国建设的高速公路。国家超算互联网计划在各算力中心之间形成高效数据传输网络，并构建全国一体的算力调度网络和面向应用的生态协作网络。更要构建和完善全国一体的算力调度网络和面向超算应用的生态协作网络，连接供需、拓展应用、繁荣生态，打造国家先进算力底座，为数字中国建设�

超算互联网数字中国建设算力中心
量子计算加速发展，PQC如何抵御“量子威胁”｜未来产业调研笔记

量子技术被认为是科技领域的下一个里程碑。量子计算带来计算能力的飞跃，使得处理复杂问题如同小儿科，无论是药物设计、气候模拟是优化大型系统，量子计算都有望大显身手。投资设立上海泓格后量子科技有限公司，利用实验室的技术成果进行产品转化，开发抗量子密码核心产品，格尔软件自身也完成了产品抗量子密码迁移路线的设计，所有产品将全面支持CNTR技术。

Chat UI:开源代码库，为HuggingChat应用提供动力

chat-ui是一个开源的聊天界面，使用开源模型如OpenAssistant或Llama。它是一个SvelteKit应用程序，为hf.co/chat上的HuggingChat应用提供支持。该产品允许用户通过自定义配置来运行和部署自己的Chat UI实例，支持多种语言模型和功能，如Web搜索、自定义模型等。

开源聊天应用 SvelteKit

360AI浏览器APP:360AI 浏览器，AI 赋能，秒懂一切。

360AI 浏览器利用人工智能技术，提供智能搜索、PDF、视频、网页总结等功能，旨在帮助用户高效获取知识，提升阅读体验。

智能搜索 PDF 阅读视频播放

FAQ Generator:免费AI生成FAQ，无需注册即可创建网站FAQ模板。

AI FAQ Generator是一款利用先进AI技术，通过分析常见问题自动生成FAQ列表的工具。它能够快速高效地生成FAQ，节省时间和资源，同时提供准确的答案，帮助提高客户满意度，并改善SEO效果。

AI技术自动化 FAQ创建

BrickCenter:一个创意无限的乐高设计平台，让你的想象力变为现实。

BrickCenter是一个在线平台，允许用户免费创建自己的乐高套装和迷你人物。它提供了一个将创意转化为详细乐高设计的工具，无论是复杂的场景还是个性化的迷你人物，用户都可以在这个平台上实现自己的设计梦想。该平台以其用户友好的界面和强大的定制功能而受到乐高爱好者的欢迎。

创意设计乐高

100 UI/UX Tips:在一个小时内学习如何制作令人印象深刻的应用程序界面。

《100 UI/UX Tips》提供了设计界面所需的所有提示，让用户感到满意。强调产品的主要优点、背景信息、价格和定位。

设计用户界面用户体验

whatwide.ai:提高生产力的AI助手，简单易用

whatwide.ai是一个提高生产力的AI助手，使用人工智能技术来节省时间并提高工作效率。它提供了50多种AI模型，包括文本生成、网站帮助、社交媒体分析、编程辅助等多种功能。whatwide.ai的优点在于高质量的内容生成、快速且安全的操作，以及多种AI类型供用户选择。

生产力文本生成网站帮助

Stream of Consciousness:一个展示想象中艺术家思绪的日常表演，通过创作和分享图像来表达创造力。

Stream of Consciousness是一个记录并分享艺术家思维的项目，通过创作和分享图像来展示创造力。它提供了一个深入艺术家思维的窗口，让人们了解艺术创作的过程和灵感的来源。

艺术创作思绪

Neurelo:是一种用于PostgreSQL、MongoDB和MySQL的云数据API平台，通过自动生成REST和GraphQL数据API、AI辅助的自定义查询API、查询可观察性等功能，简化和加速现代云应用程序开发。

Neurelo是一个专为云数据库而设计的平台，通过使用云API和人工智能技术，提供自动生成API、自定义查询API、查询可观察性和Schema as Code等功能，以提高开发人员的生产力。Neurelo能够简化数据库编程相关的复杂性，并具备可伸缩性、安全性和查询优化能力。

数据库云应用程序 API

EdrawMax:智能且风格多样的图表解决方案，简化您的想法可视化过程。

EdrawMax是一款功能强大的图表设计软件，它提供一站式的图表解决方案，适用于流程图、思维导图、组织结构图、甘特图、平面图和ER图等210多种图表类型。它具有简洁的用户界面，类似于MS Office的干净、整齐的界面，直观且易于导航的工具集，以及无缝的拖放功能。此外，EdrawMax还提供了23000多个用户制作的模板，850个精心制作的内置模板，以及26000多个免费符号，覆盖所有图表类型。它还具备AI功能，可以生成和分析22种类型的图表，包括文本到绘图和图片到绘图以及AI聊天。EdrawMax支持跨平台集成，可以在云端保存文件并通过链接共享，支持通过社交媒体或电子邮件发送作品，并能以13种格式导出图表，包括VSDX、PPTX和SVG等。此外，EdrawMax遵循GDPR标准，使用最高级别的256位SSL加密，确保用户隐私和数据安全。

生物计算领域，为什么超算安腾比通用计算机算得还要快？

今日大家都在搜的词：

热文

站长商机