首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

聚焦大模型训练效率提升 北大依托昇腾突破细粒度混合并行技术

2025-08-01 16:34 · 稿源: 站长之家用户

人工智能大模型迅猛发展的当下,大模型参数和计算量呈指数级增长,大规模深度学习模型的训练离不开多硬件设备的分布式计算。在鲲鹏昇腾科教创新卓越中心的算力支持下,北京大学计算机学院崔斌教授团队创新研发了面向大模型的高效分布式训练框架,大幅提升了大规模分布式训练模型的效率。

针对模型训练任务的多样性和复杂性所带来的负载不均问题,研究团队创新设计出了细粒度模型切分与并行策略搜索算法。此方法依托昇腾强大的计算资源管理能力,及算子优化技术对训练策略的适配,完成了统一训练接口到智能切分策略的全过程。首先通过总结多种大模型训练的共同特点,设计出统一的接口来启动和管理不同任务负载的模型训练任务,对训练时所花费的算力、内存、网络通信等进行精确地计算。接着基于这些数据细致拆解庞大且复杂的大模型,根据不同模块分配不同的训练策略以适应各模块的负载差异,实现训练任务的高效并行。目前,该方案已实现比分片数据并行、3D 并行等全局模版化并行方案提升15% 的训练效率。

除此之外,团队还解决了分布式计算所涉及的硬件间通信传输效率问题。结合昇腾高速互联总线技术的高带宽低时延优势,系统会很根据不同的通信需求,对硬件设备进行分组以优化组队时间,运用计算通信重叠技术让“计算”和“通信”同步进行,提高训练流水线的效率,并在模型切分的决策时考虑计算通信重叠的性能影响,综合多方面因素选取最适合的分布式运行方案,最终实现数据传输效率和资源利用率的最大化。

该研究成果不仅为模型大规模训练提供了高效的解决方案,更展现了自主算力在分布式计算领域的巨大潜力。目前,研究成果已在国际顶级学术会议NeurIPS、ICLR、AAAI发表3篇论文,为国内AI技术突破提供了理论支撑与实践范式。

北京大学 鲲鹏昇腾科教创新卓越中心的这一突破彰显了校企协同创新的显著成效。未来,中心将持续加速AI前沿技术在自主计算平台的深度落地,为我国人工智能产业的自主化突破提供强劲动能。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • 每日互动参与发起《人工智能安全行业自律倡议》 守护人工智能产业可持续发展

    9月17日,2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开,会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起,提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识,旨在推动构建可控、可信、可靠的人工智能产业生态,为全球人工智能治理贡献中国智慧。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • 十方融海:以开源生态为基,绘就“人工智能 +”产业融合新蓝图

    国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践,成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限,实现多模态交互与跨领域知识融合,覆盖教育、办公、养老、文体等多元场景。通过开放共享模式,十方融海有效降低AI应用门槛,激发行业创新活力,助力我国人工智能产业迈向新征程。

  • 2025年国产主流分布式数据库产品

    随着数字化转型加速,国产分布式数据库在性能、安全性和自主可控方面取得显著进步,成为企业核心技术栈的重要组成部分。文章重点介绍了OceanBase、ArgoDB、TDSQL、PolarDB、GaussDB、GBase8a、GoldenDB和TiDB等主流产品,涵盖金融级高可用、HTAP混合负载、云原生架构等核心能力,广泛应用于金融、电信、政务等领域,展现出头部厂商激烈竞争的市场格局。

  • 普适性覆盖人工智能典型场景 寒武纪产品技术优势凸显

    中科寒武纪科技预计2025年全年实现营业收入50亿至70亿元。公司已全面掌握智能芯片及基础系统软件研发核心技术,截至2025年6月30日,累计获授权专利1599项。2025年上半年,公司实现营业收入28.81亿元,同比增长4347.82%,净利润扭亏为盈。寒武纪持续优化智能处理器微架构及指令集,新一代产品将提升编程灵活性、易用性、性能及能效。高盛维持对公司的积极看法,上调12个月目标价至2104元,并调高2030年预期EBITDA及企业价值倍数。

  • 王忠林赴格创东智调研人工智能产业高质量发展情况

    9月11日,湖北省领导王忠林一行调研格创东智人工智能产业发展。公司CEO何军汇报了自主研发的工业智能平台、能碳管理系统等应用成果。王忠林强调要深化人工智能在工业研发、生产等领域的应用,促进全要素智能联动,更好服务制造业向智能制造转型升级。

  • 当智驾遇上国庆,亿万克提供高效数字底座!

    本文探讨智能驾驶技术发展现状与挑战。随着L4/L5级自动驾驶需求增长,行业面临云端算力不足、运维复杂、系统扩展难等痛点。亿万万构建了以边缘计算节点、GPU计算节点和分布式存储系统为核心的数字平台解决方案:边缘节点处理实时任务,GPU服务器提供高性能计算,分布式存储实现数据统一管理。该平台支持机器视觉、深度学习等应用,助力企业构建稳定高效的智能驾驶基础设施。

  • 祝贺!诺云荣登“人工智能+”新质生产力领航企业百强!

    2025年9月8日,国务院发布人工智能发展指导意见后,诺云凭借AI营销创新实践入选“人工智能+新质生产力百强榜单”,成为河南唯一入选企业。作为数字化营销技术服务商,诺云提供企业直播SaaS系统与私域运营工具,覆盖电商直播、企业培训等全场景需求。已服务超20万家企业,覆盖3亿用户,拓展至零售、教育等150多个行业,客户包括携程、华为等头部机构。诺云将持续深化AI技术应用,激发新质生产力潜能。

  • 我国首个政务大模型安全国家标准发布 百度深度参与制定

    日前,我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》(下称《规范》)正式发布。百度作为核心参编单位,凭借其在人工智能安全及政务服务领域的深厚积累,深度参与了该标准的制定工作,为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头,联合百度等国内领先企业共同制定�

今日大家都在搜的词: