首页 > 业界 > 关键词  > 混合专家模型最新资讯  > 正文

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

2025-05-20 13:43 · 稿源: 量子位公众号

要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处,就在于把不同的任务分配给擅长处理的专家网络,让整个系统性能得以提升。但你知道吗?正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。因为在大量任务来临之际

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 顺丰同城(09699)上半年收入净利润双高增,结合AI、无人车优化配送网络效率

    顺丰同城2025年上半年业绩亮眼,收入同比增长48.8%至102.36亿元,首次半年营收破百亿;毛利润增长43.8%至6.81亿元,净利润增长120.4%至1.37亿元。增长主要受益于餐饮外卖及即时零售行业快速发展,同城配送订单量增长超50%。公司深化与头部客户合作,覆盖餐饮、商超、医药等多场景,无人车配送和AI技术应用提升运营效率,累计投入超300台无人车覆盖60多个城市。

  • Kimi K2模型更新至0905版本:更强代码能力 更快API性能

    月之暗面科技有限公司宣布其Kimi K2模型更新至0905版本,带来更强的代码能力和更快的API性能。此次更新进一步提升了Kimi K2在真实编程任务中的表现,特别是在公开基准测试和实际编程任务中展现出更好的性能。 Kimi K2模型的Agentic Coding能力得到显著提升,这使得它在处理复杂的编程任务时更加高效。同时,前端编程体验也得到了升级,生成的代码不仅更加美观,而且更具实用

  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • 海尔空调构建两大网络助力份额提升

    8月28日,海尔智家发布2025半年报,空调业务表现亮眼:线下市场份额达19.7%,同比提升1.2个百分点;线上份额11.3%,增长1个百分点。公司依托“两大网络”战略推进渠道转型,通过产品优化、营销创新及供应链全球布局,持续提升竞争力。数字库存模式已在实践中取得实效,东北地区夏季高温期间销售额增量超3亿元。预计全年收入有望实现两位数增长。

  • 业界首例中国电信完成长距跨DC分布式无损智算推理网络技术验证

    中国电信广东公司联合中国电信研究院在智算网络领域实现重大突破,成功完成DeepSeek-671B满血版长距跨数据中心分布式无损计算推理网络技术验证。该成果为企业按需扩容算力及推理数据本地化存储提供了突破性技术方案,标志着中国电信在智算网络技术创新上迈出关键一步。

  • 3只飞鼠19楼跃出上演“翼装飞行” 专家:一种自然反应

    ​近日,在陕西安康,一户居民在自家19楼的阳台上意外捕捉到了令人惊叹的一幕:三只红白鼯鼠,俗称“飞鼠”,受惊后从高楼跃出,展开了一场如同“翼装飞行”般的空中滑翔。这一罕见场景被住户拍摄下来,并迅速在网络上引发热议。 据拍摄者刘先生介绍,这些飞鼠平日里白天休息,夜晚活动,他在此居住六七年之久,这些小动物一直未受打扰。然而,这次它们似乎受到

  • 技术赋能强防护,QQ平台严打网络诈 骗

    QQ平台持续加强反诈力度,通过技术赋能、生态协同等手段,重点打击仿冒、游戏、工具类诈 骗及涉未成年人诈 骗。上半年处置涉诈账号超450万个,协助公安机关破获多起案件。平台优化安全提醒机制,推出智能反诈助手,日均处理咨询3万余次,劝阻成功率89%。未来将持续完善技术防控,呼吁用户提高防范意识,共建清朗网络空间。

  • 以一体化算网驱动技术变革,业内专家共话超算互联网

    自2023年《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》发布以来,国家超算互联网建设提速提质,在用户数、应用数、任务数及算力调度规模上屡创新高。当前正值全国数字基础设施布局进入“建用并重、以用促建”新阶段,超算互联网积极探索技术布局与生态发展战略新方向。近日在北京举办的战略研讨会围绕下一代计算制高点抢占策略、算力服务价值链打造等议题展开深入探讨,多位专家强调需加强核心技术攻关,明确国家层面一体化架构,避免重复建设与资源碎片化。

  • 柠檬泡水真能补维C吗 专家回应:没啥用

    水果是供应人体维生素C的主要来源之一,维生素C可以抗氧化、延缓衰老、帮助胶原蛋白合成。 所以很多爱美人士都成为了水果的爱好者,认为水果有天然的美容功效,有网友问:柠檬泡水能不能补维C? 据央视频消息,中国农业大学食品学院范志红教授指出,柠檬泡水用来补水还是不错的,还是补充维C真没啥用。

今日大家都在搜的词: