首页 > AI头条  > 正文

华为发布昇腾大模型:无GPU训练高数大题仅需2秒!

2025-05-30 15:44 · 来源: AIbase基地

最近,华为通过其新推出的 “昇腾 + Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。

在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。在其技术报告中,华为详尽披露了在 CloudMatrix384超节点上进行的多项技术创新,包括改进的通信机制和负载均衡策略。这些创新使得大规模 MoE 训练的专家并行通信开销几乎降至零,同时有效平衡了计算负载。

image.png

此外,华为在提高单节点算力方面也取得了显著成效。他们通过优化训练算子的执行,成功将微批处理规模提升至原来的两倍,同时解决了算子下发的效率问题。这种技术的进步意味着,华为的系统在面对复杂计算任务时,能够更加高效地利用现有资源。

华为的这一系列技术创新不仅让 MoE 模型的训练效率大幅提升,更为未来大规模 AI 模型的训练与应用打开了新的可能性。

  • 相关推荐
  • 华为发布首款鸿蒙折叠屏电脑,花瓣地图 PC 版本适配上线

    2025年5月19日,华为在成都举办新品发布会,推出全新鸿蒙电脑HUAWEI MateBook Pro和非凡大师家族新成员HUAWEI MateBook Fold。其中MateBook Fold是全球最大商用折叠屏电脑,搭载HarmonyOS系统,展开为18英寸大屏,折叠后仅13英寸,厚度7.3mm,重量1.16kg,完美解决大屏与便携难以兼得的难题。同时发布的花瓣地图PC版适配折叠形态,支持3D地球模式、多窗口操作等功能,实现跨设备无缝协同。华为还推出WATCH FIT 4 PRO智能手表,支持离线地图和15000+高尔夫球场导航。花瓣地图已覆盖全球160+国家和地区,提供70+种语言服务,持续升级全球出行体验。

  • 华为发布首款鸿蒙电脑!余承东:鸿蒙必将成为改变世界的蓬勃力量

    华为在5月19日鸿蒙电脑新品发布会上推出首款鸿蒙折叠电脑MateBook Fold和MateBook Pro。余承东表示,鸿蒙电脑将打破Windows和Mac OS长期垄断,尽管国产软件起步晚基础弱,但华为坚持做难而正确的事。他强调鸿蒙电脑从系统内核到生态全链路自主可控,虽然刚刚起步需要持续成长,但在生态伙伴支持下必将成为改变世界的力量。余承东号召所有开发者共建鸿蒙新生态,用每一行代码改写中国电脑产业的未来。

  • 低成本、速度、1080p清 可灵2.1打造视频大模型新标杆

    快手可灵AI推出全新2.1系列视频生成模型,包含标准版(720p)和高品质版(1080p),主打高性价比与高效生成。大师版则提供更卓越的运动表现和语义响应,分辨率提升至1080p。新模型在成本控制方面优势明显,5秒视频生成仅需20-35灵感值,速度不到1分钟,处于行业领先水平。模型质量全面提升,动态细节更丰富、物理模拟更真实、提示词响应更精准。目前可灵AI全球用户突破2200万,累计生成超1.68亿视频,商业化进程加速,2025年Q1营收超1.5亿元。新系列将满足从短视频创作到专业影视制作的多场景需求。

  • 加速产业智能化发展 每日互动“可信数据空间+可控大模型享会成功召开

    5 月 17 日,“瓯江论数数安未来” 2025 数据安全发展大会在温州开幕,行业大咖、专家学者、企业精英相聚瓯江之畔,共商数据要素市场化配置改革的“温州实践”,共绘数据安全与价值释放的“中国方案”。作为中国(温州)数安港“九个一”基本架构之一,本次数据安全发展大会旨在深入剖析数据产业发展新趋势、新挑战、新机遇,挖掘数据在数字经济时代的潜在价值,�

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 音箱智商史诗升级 AI大模型渗透率已超20%

    目前上市的新品已经全面搭载AI大模型技术,例如小度大金刚Pro和小米智能音箱等搭载大模型技术的新品在4月上市,兼顾了声学、美学和语音技术的多方面升级。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 中国石油发布3000亿参数昆仑大模型华为、中国移动、科大讯飞联合打造

    日前,中国石油发布3000亿参数昆仑大模型,标志着中国石油在人工智能领域迈出关键一步。 据了解,昆仑大模型由中国石油、中国移动、华为、科大讯飞联合打造,2024年8月完成备案,成为中国能源化工行业首个通过备案的大模型。 去年8月28日,330亿参数昆仑大模型发布,11月28日又发布700亿参数昆仑大模型。

  • 魅族Flyme AIOS 2宣布接入阿里云端到端大模型Qwen Omni

    Flyme AIOS2系统引入全新设计的智能助手Aicy,其界面设计更具呼吸感与动态效果,同时搭载升级后的思考引擎,可实现更精准的语义理解和场景响应。值得关注的是,该系统成为业内首家接入阿里云自主研发的Qwen Omni云端到端大模型的操作系统,支持超低延迟的自然语音交互,并覆盖多地

今日大家都在搜的词: