首页 > 业界 > 关键词  > 正文

传闻称基于AMD硬件方案的Frontier Exascale超算的启动进展不顺

2022-10-10 12:00 · 稿源: cnbeta

橡树岭国家实验室(ORNL)的 Frontier 超算,使用了 AMD EPYC Trento CPU 和 Instinct MI550X GPU 加速卡。为构建这套百亿亿级(Exascale)超算系统,ORNL 还选用了 HPE 的 Slingshot 连接方案。据悉,HPE 的 Cray EX 架构,是专为大型应用程序而创建的。如果一切顺利,Frontier 将于 2023 年起向研究人员开放访问,以协助其开展相关科学研究。

尴尬的是,由于硬件内部频繁出现故障,Frontier 超算甚至无法在一整天内保持良好运行。

据悉,在启动初期,这套超算最高只能达成 1 ExaFLOPS 的 FP64 性能 —— 距 1.685 ExaFlops 的预设目标想去甚远。

虽然官方尚未披露确切信息,但有传闻称 —— 为 HPE Cray 超算打造的 Slingshot 网络互联,与 HPE 集群发生了冲突。

此外据说 AMD Instinct MI250X GPU 加速卡,也和 EPYC Trento CPU / Slingshot 互连方案水土不服。

ORNL Frontier 超算项目负责人或研究人员,尚未就上述两则传闻发表任何意见。

美国能源部(DOE)百亿亿次计算项目团队的 Mike Bernhardt 指出 ——“随着 ORNL Frontier 的全面集成,该超算将于明年开始向研究人员开放访问”。

至于拖累 Frontier 超算全面启动的任何担忧或问题,他同样没有给出直接的回应。

Mike Bernhardt 补充道:

作为 Exascale 计算项目的合作伙伴,HPE 和 AMD 已于今秋提前向 ORNL 交付了 Frontier 新系统。

然而超算的安装和集成,是个相当庞大且复杂的工作、目前仍在进行之中。

现阶段的进展表明,一切都在按计划进行,且有望如期在明年向科学用户开放。

此外需要指出的是,AMD 的 MI250X GPU 计算卡仅适用于特定客户,因而缺乏横向基准来支持相关传闻。

美国能源部正与 ORNL 密切合作,以在错过了最初定下的 2022 年期限之后,于 2023 年 1 月 1 日全面投入运行。

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词: