首页 > 业界 > 关键词  > NVIDIA最新资讯  > 正文

国产GPU正式进入万卡万P时代!摩尔线程智算集群扩展至万卡

2024-07-06 08:56 · 稿源: 快科技
国产GPU正式进入万卡万P时代!

国产GPU正式进入万卡万P时代!

游戏显卡AI加速卡领域,NVIDIA一家独大。而现在,我们不仅需要自己的游戏卡,更需要自己的加速卡。

摩尔线程扛起了这一重任。继交付全国产千卡千亿模型算力集群后,又率先拓展到了万卡、万P、万亿规模。

摩尔线程万卡智算集群

摩尔线程宣布,其AI旗舰产品夸娥(KUAE)智算集群解决方案重大升级,从千卡级别扩展至万卡规模,具备万P级或10E级浮点运算能力。

万卡集群由1万张或更多GPU组成,主要用于训练超大规模基础大模型。它整合了高性能GPU计算、RDMA网络、并行文件存储等技术,可大幅提高训练效率和缩短训练时间。

国外科技巨头布局万卡集群

国外科技巨头纷纷部署了万卡集群。马斯克的新一代AI聊天机器人Grok 3使用了10万张NVIDIA H100加速卡进行训练。谷歌的A3 Virtual Machines拥有2.6万块H100 GPU,Meta的两个集群拥有24576块H100 GPU。

国内企业积极推进万卡集群建设

国内企业也在积极推进万卡集群建设。字节跳动搭建了一个12288张卡的训练集群,科大讯飞建成了首个支持大模型训练的超万卡集群算力平台。

摩尔线程挑战万卡集群

万卡集群并非简单的计算卡叠加,需要解决超大规模组网互联等众多难题。摩尔线程作为一家成立不到4年的国产GPU企业,为何要去挑战这一难题?

摩尔线程希望建设一个规模超万卡、场景更通用、生态兼容好的加速计算平台,优先解决大模型训练难题。

夸娥全栈解决方案

夸娥是摩尔线程的智算中心全栈解决方案,包括基础设施、集群管理平台和模型服务平台。它支持大规模GPU算力集群的建设、运营管理,提供开箱即用的体验。

摩尔线程万卡集群优势

摩尔线程万卡集群具备超大显存总容量、超高速卡间互联总带宽和超高速节点互联总带宽,能实现超强的算力,MFU最高可达60%。

它还拥有卓尔不群的稳定性,平均无故障运行时间超过15天,周均训练有效率超过99%。

强大的通用性

摩尔线程万卡集群支持所有主流大模型训练,可加速不同架构、不同模态的大模型。它兼容主流分布式训练框架,并提供高效易用的编程语言和自动化迁移工具。

无缝迁移

已经适配过摩尔线程千卡集群的用户无需额外工作即可无缝运行在万卡集群上。对于首次适配万卡集群的用户,迁移时间也只需几个小时。

全栈覆盖

摩尔线程实现了从芯片到算力卡、从一体机到节点集群的全栈式覆盖,支持从单机多卡到多机多卡、从单卡到千卡万卡集群的无缝扩展。

战略签约

摩尔线程已完成青海零碳产业园万卡集群、青海高原万卡集群和广西东盟万卡集群等三项战略签约。

生态迅速扩大

摩尔线程的生态正在迅速扩大,与国内外AI厂商、云厂商、科技厂商等建立了深入合作。

WAIC 2024展示

在WAIC 2024期间,摩尔线程展示了全栈解决方案,包括芯片、算力卡、服务器、一体机节点、AI算力底座、AIGC创作生产力、产业数智化升级等。

国产GPU正式进入万卡万P时代!摩尔线程智算集群扩展至万卡

产业数智化升级应用

基于摩尔线程夸娥智算集群,气象、公共安全、数字交通、辅助决策、智慧安防、智能金融、智慧政务等领域实现了产业数智化升级应用。

值得一提的是,风乌大模型通过无缝迁移至摩尔线程万卡集群,实现了全国产化,性能、精度达到国际先进水平。

举报

  • 相关推荐
  • 华为云张平安:打造算力黑土地,繁荣AI百花园,加速行业智能跃迁

    8月28日,华为云CEO张平安在贵阳数博会上表示,未来十年算力需求将增长数万倍。华为云坚定打造算力“黑土地”,通过昇腾AI云服务和Tokens服务,以高性能、低成本满足客户需求,加速行业智能化。华为云算力规模同比增长近250%,昇腾AI客户从321家增至1714家,并在贵安部署最大规模CloudMatrix超节点,支持央国企等客户。张平安强调需以AI原生思维重构应用与数据,抓住智能时代机遇。

  • 华为云张平安:坚持打造“算力黑土地”,加速行业智能跃迁

    8月28日,中国国际大数据产业博览会在贵阳开幕。华为云CEO张平安表示,未来十年算力需求将增长数万倍,华为云坚定打造“算力黑土地”,通过昇腾AI云服务和Tokens服务,以高性能、低成本满足客户需求。华为云算力规模同比增长近250%,昇腾AI云服务客户从321家增至1714家。在贵安部署最大规模CloudMatrix384超节点,打造东数西算标杆。张平安强调,需以AI原生思维重构应用、数据和流程,抓住智能时代机遇。

  • 降低创作门槛!爱诗科技新一代生成式大模型加速AI视频大众化

    爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5,实现秒级高质量视频生成,支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升,覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手,降低使用门槛,用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用,加速行业落地。

  • MCP模型库深度解析:AI智能体工具调用生态的多元化与规模化发展

    AIbase旗下MCP模型库收录服务数量突破12万,标志着AI智能体生态迈向成熟。MCP协议为AI工具调用提供标准化蓝图,其成功取决于生态规模与活力。平台覆盖工具、知识库、数据源、控制系统等多元领域,展现高度多样性。一站式整合平台降低开发成本,助力企业快速构建复杂应用,成为感知AI技术风向的重要窗口。

  • 最高提效8倍!腾讯游戏发布专业游戏AI大模型,美术师做动画不用辣么“肝”了

    在最近与科隆国际游戏展同期举办的Devcom开发者大会上,AI再次赚足了脸面。 微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题,“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。 近年来,游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

  • 跨越四大洲的美丽探索:Vida Glow 十年创新,定义口服美容新范式

    Vida Glow是源自澳大利亚的口服美容品牌,2014年由Anna Lahey创立,以天然水解海洋胶原蛋白粉为核心产品。品牌通过法国专利水解技术提升吸收率,产品覆盖全球高端百货及医美机构,平均每4秒售出一罐,被誉为全球胶原蛋白领先品牌。目前产品线已扩展至日常护理、高级修护和女性健康系列,致力于以科技推动口服美容行业发展。

  • 独家消息:天玑9500 AI算力翻倍,大模型响应速度更快了

    联发科天玑9500完成NPU架构升级,首次引入全新IP硬件。采用“存算一体”高效设计,AI策略从拼性能转向追求均衡能效比。终端AI落地能力增强,旗舰芯片算力提升让手机可运行更聪明的大模型,响应更迅速。日常AI功能如图像处理、视频生成、文本创作等响应更快效果更好。“存算一体”技术通过就地计算降低功耗,减少数据传输更节能。手机AI技术正从“实验室性能”向“用户体验”过渡,算力提升带来更广泛AI应用场景,能效优化保障日常使用稳定性,整体提升手机AI实用价值。

  • 维谛(Vertiv)宣布收购生成式AI软件领军企业Waylay NV

    维谛技术(Vertiv)宣布收购比利时生成式AI软件企业Waylay NV,旨在提升关键数字基础设施的运营智能化水平、系统优化能力及服务体验。此次收购将整合Waylay先进的AI驱动自动化平台,帮助客户实现数据中心电力与热管理系统的实时监控、预测性维护和动态优化,应对AI工作负载快速增长的需求。维谛CEO表示,这将加速公司智能化基础设施愿景的实现,助力客户提升运营效率与�

  • 同比大增210.6%!远东股份半年报亮眼:“电能+算力+AI”布局抢先机

    远东股份发布2025年半年报,业绩大幅增长创历史新高。上半年营收129.76亿元,同比增长14.38%;净利润1.44亿元,同比大增210.60%。公司以“电+算+AI”为核心战略,在人工智能、算力等新兴业务领域表现突出,相关板块营收同比增长204.61%。未来将持续推进业务向AI方向升级,重点布局高速连接器、光缆、AI服务器及数据中心备用电源等领域,加速制造体系全面智能化转型。

  • 阿里云AI火花大会:规模化前夜,AI务实派靠场景破局

    阿里云在深圳成功举办AI创新应用大会,提出要将"云+AI"技术转化为千行百业的商业动能。大会吸引了近千家企业参与,探讨AI技术从理论走向商业实践的路径。阿里云智能集团副总裁刘湘雯指出,AI不仅是技术演进,更是生产力革命。会议聚焦大模型与AI Agent的融合机遇,提出企业智能化转型需把握四大趋势:技术迭代加速、开源填补鸿沟、智能体从"工具人"变为"决策者"、交互革命重构人机触点。阿里云通过三层落地逻辑(模型API Server、Agent对接层、行业解决方案)助力企业穿透技术迷雾,并发布AI应用先锋计划,联合生态伙伴加速AI应用从概念验证到规模化落地。

今日大家都在搜的词: