首页 > 传媒 > 关键词  > XPU/vXPU双模式最新资讯  > 正文

百度智能云联合昆仑芯、HAMi,落地双模式算力调度方案,提升算力利用率

2025-11-03 17:14 · 稿源: 站长之家用户

百度智能云混合云联合昆仑芯、HAMi(密瓜智能发起并主导的 CNCF 开源项目),正式推出基于昆仑芯 P800的 XPU/vXPU 双模式算力调度方案 —— 该方案已率先在某金融客户的昆仑芯集群中落地,为智能客服、营销辅助等十余类 AI 业务提供兼具稳定性与灵活性的算力支撑。客户可在同一集群内灵活调用昆仑芯 P800的整卡 XPU 与虚拟化 vXPU 资源,让国产算力既高效匹配业务需求,又实现资源的最大化利用。

1. XPU/vXPU双模式调度方案,把集群中的昆仑芯 P800算力用透

百度智能云联合 HAMi,基于昆仑芯 P800构建「XPU 整卡 + vXPU 虚拟化」双模式资源调度体系:XPU 整卡模式通过拓扑寻优调度与健康度评估,实现「多卡单任务」的最优资源调度,保障大规模训练性能和稳定性,并避免资源碎片化;vXPU 虚拟化模式以多规格切分支持「单卡多任务」,最大化资源利用率,灵活适配推理、开发等轻量化场景。双模式协同发力,让昆仑芯 P800的每一份算力「算尽其用」,为各类 AI 业务提供高效算力支撑。

XPU 整卡模式:拓扑寻优调度 + 集群健康度评估,保障大规模训练性能与集群稳定

在多卡训练等通信性能敏感场景中,调度策略直接决定集群长期可用性与性能稳定性。基于昆仑芯 P800的物理拓扑特性,方案通过两层逻辑保障整卡模式的「高性能和高稳定性」。

其一,系统自动识别昆仑芯服务器「左右侧翼」物理分区,优先在单侧翼内调度资源,减少跨侧翼通信开销的同时,避免资源零散占用。

其二,当多个节点都能满足需求时,系统会评估调度前后对节点整体结构的影响,优先选择能保持或改善拓扑规整度的节点,留存更多完整拓扑单元,降低后续调度失败或回填导致的性能波动。

凭借「节点内拓扑寻优调度+集群内健康度评估」,运维团队不再需要频繁人工干预去「手动拼卡」,大模型训练可获得稳定通信性能,集群资源利用更紧凑。

vXPU虚拟化模式:多粒度切分 + 显存自动对齐,用透每一分算力,简化管理难度

针对推理、开发测试、模型验证等轻量化任务的细粒度算力需求,vXPU 虚拟化模式为昆仑芯 P800打造了「算力精准切分 + 便捷管理」的解决方案。

该模式支持多任务共享单张昆仑芯 P800显卡,提供1/4卡(24GB 显存)、1/2卡(48GB 显存)两种切分规格。实际使用中,用户仅需声明所需显存,系统便会自动向上匹配最优切分规格 —— 如申请20GB 显存时,系统自动分配24GB 规格,无需用户手动换算,大幅降低操作成本。

同时,为避免实例间干扰,方案引入「同规格共享」机制 —— 同一物理卡仅允许相同规格的虚拟实例共享,进一步简化了资源隔离与管理复杂度。

UUID 精准控卡:自动化打底,人工补位,特殊场景不「卡壳」

依托整卡模式的拓扑寻优调度、vXPU 虚拟化模式的显存自动对齐等自动化能力,日常算力调度已实现少干预甚至无干预。针对灰度测试、硬件问题复现等特殊场景,方案预留「人工调节通道」 —— 运维人员只需指定物理卡 UUID,即可直接选定或排除特定卡片。比如灰度发布新模型时,无需调动全量资源,指定部分卡片即可完成测试验证;硬件故障复现时,也能精准定位问题卡片进行调试,无需整机下线。

通过系统自动化调度与人工手动调节的结合,面对大模型训练、推理与开发等复杂场景,既能保障日常调度效率,又具备「因地制宜」的算力管理灵活性,轻松化解运维难题。

2. 结语

XPU/vXPU 双模式协同调度方案在金融行业的落地,是百度智能云混合云联合 HAMi 在国产 AI 硬件调度领域的重要实践 —— 既验证了「场景驱动调度策略」的技术创新价值,也展现了开源生态与企业服务结合的落地能力。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 1人开发2个月,8000元成本拿到破万DAU:年轻人的机会来了?

    如今用AI做游戏不稀奇,用AI做AI游戏也不稀奇,在B站上你可以搜到一大堆相关的内容。 但最近葡萄君发现了一款有点特别的游戏:《妹居物语》。 这款游戏的卖相属实不算好:简陋的UI、朴素的立绘、单调的场景......与其他同类产品利用AI低成本地创造刺激视觉效果的做法完全不一致。

  • 蝉联江西首富!陈天石1800亿财富背后的“科学家情怀”

    寒武纪创始人陈天石以1800亿财富蝉联江西首富,展现科学家创业者的独特路径。他秉持"坐冷板凳"精神突破技术封锁,坚持科技报国初心,与兄长陈云霁组成"天才兄弟"创业典范。其企业不仅专注AI芯片研发,更构建创新人才培养体系,推动前沿科技普及。陈天石融合科学家严谨与企业家务实,重新诠释新时代赣商精神——既是财富创造者,更是科技创新引领者与文化推动者。

  • 超800台无人车落地全国105城,顺丰同城再拓校园无人车餐配场景

    顺丰同城与数字化门店服务商“收钱吧”合作,在四川汽车职业技术学院推出无人车校园智能餐配服务。该服务通过“无人车+骑手”协同模式,重点解决午晚高峰集中送餐需求,提升校园配送效率。无人车负责食堂至宿舍区的定点批量转运,骑手负责两端接驳,形成三段式配送闭环。顺丰同城已在全国布局超800台无人配送车,覆盖105个城市,此次合作将进一步拓展校园等半封闭场景的无人配送应用。

  • 男子从西安徒步8000公里到罗马:受影视启发 磨坏19双鞋

    ​近日,一位来自西安的男子(抖音ID:龙行者(徒步丝绸之路))凭借着非凡的毅力完成了徒步从中国至罗马的壮举,引发广泛关注。 该男子的这一想法源于电视剧《大汉天子》中张骞出使西域的情节,受此启发,他萌生了重走丝绸之路、徒步前往罗马的大胆想法。为了达成这个极具挑战性的目标,他通过卖房、贷款等方式筹集了20万元资金。 在长达两年的时间里,这位男子背

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • 纯白颜值、双模切换:“纯白小金刚”技嘉M27UP ICE显示器登场

    技嘉推出专为纯白电竞空间设计的M27UP+ICE显示器,定位两千元价位段。产品集高性价比、优雅纯白外观与强劲性能于一身,配备4K/160Hz与FHD/320Hz双模式切换、1ms响应时间,覆盖95% DCI-P3色域并支持HDR400认证。内置战术键、智能OD等电竞辅助功能,配备全功能Type-C接口并支持KVM多设备切换。提供三年质保及个人送保服务,是兼顾颜值与性能的电竞显示器优选。

  • 算力无界,AI无距!超聚变发布FusionXpark™随身智能体开发平台

    10月24日,超聚变公司发布FusionXpark™智能体开发平台,实现AI算力从云端下沉至桌面设备。该平台搭载GB10架构,提供1PFLOPS本地算力,支持200B参数模型推理,助力开发者在边缘端运行高参数模型。发布会展示了政务、金融、工业等五大行业的30类“超级员工”智能体应用,通过私有化部署保障数据安全。专家指出,这一创新将推动AI普惠化,重塑产业生态。

  • vivo Y500 Pro官宣11月10日发布:同档首发2亿HP5主摄

    vivo将于11月10日发布Y500Pro新机,定位“国民小旗舰”。该机搭载三星HP5主摄,配备2亿超高像素与专业防抖技术,主打清晰影像记录。设计采用旗舰同款AG玻璃工艺与超窄边框,首配1.5K护眼屏兼顾显示细腻度与用眼健康。性能方面搭载超百万跑分处理器,支持《王者荣耀》120帧模式,配合新系统承诺五年流畅使用。续航配备7000mAh半固态电池,支持-30℃极端环境使用,并通过IP68/69防水认证,成为行业首款获国标可靠性认证的中端机型。

  • 红魔11 Pro系列让旗舰手机迈入8000mAh时代:明天见

    红魔宣布红魔11 Pro系列让旗舰手机迈入8000mAh时代,该机不仅配备8000mAh超大电池,同时支持80W无线充电,新品将在明天正式发布。 除了强续航,红魔11 Pro系列还首发搭载全新的脉动水冷引擎,这是行业首款支持水冷 风冷的旗舰手机。据悉,历经多轮设计迭代,红魔团队成功在手机内放入超精细液体流道,保证水冷液能够在机身中无阻循环,帮助手机高效散热。 为了提升水冷�

  • 抖音电商erp系统为什么选择快麦ERP?抖音电商erp软件选快麦erp好吗

    随着抖音电商快速发展,抖音电商ERP系统应运而生,成为商家高效运营的关键工具。该系统专为抖音平台定制,集成订单管理、库存管理、物流跟踪和数据分析等功能,帮助优化业务流程、提升运营效率。快麦ERP作为优质选择,深耕电商领域多年,具备稳定性和数据安全性,支持与抖音平台无缝对接,自动获取订单、一键发货,大幅提高订单处理效率。其智能库存监控和数据分析功能助力商家科学决策,适用于各类规模商家,是实现业务持续增长的可靠伙伴。

今日大家都在搜的词: