首页 > 业界 > 关键词  > AI推理最新资讯  > 正文

华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源

2025-08-13 09:49 · 稿源: 快科技

快科技8月13日消息,据媒体报道,在2025金融AI推理应用落地与发展论坛上,华为重磅发布了其AI推理创新技术UCM(推理记忆数据管理器)。这项技术被业内视为有望重塑国内AI推理格局的关键突破。

UCM技术的核心在于其先进的KV Cache系统,通过融合多种缓存加速算法工具与精细的分级管理策略,高效处理推理过程中产生的大量记忆数据。这带来了多重显著优势:有效扩大上下文窗口,确保推理过程的高吞吐量与低延迟,并显著降低每个Token的推理成本。

尤为关键的是,UCM技术有望缓解当前因HBM(高带宽内存)资源短缺导致的任务停滞与响应延迟问题,为AI应用提供更流畅的体验,从而减少行业对HBM的过度依赖。

此次论坛不仅是UCM技术的首次亮相,华为还宣布将携手中国银联,共同发布双方在AI推理领域的最新应用成果。论坛还邀请了来自信通院、清华大学、科大讯飞等机构的专家,分享他们在优化大模型推理速度及提升用户体验方面的前沿经验。

华为数据存储产品线副总裁樊杰在演讲中强调了高质量行业数据与高性能存储对AI发展的重要性。他指出,未来的AI飞跃将极大依赖于此,高性能AI存储系统能将数据加载时间从数小时压缩至几分钟,同时使算力集群的效率实现倍增。

华为计划于2025年9月正式开源UCM技术,首发平台为魔擎社区。后续,华为将逐步将该技术贡献给业界主流的推理引擎社区,并向所有采用 共享一切”(Share Everything) 架构的存储厂商及生态伙伴开放共享。

举报

  • 相关推荐
  • 华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖

    华为将于8月12日在2025金融AI论坛发布AI推理领域突破性技术成果。该技术有望降低中国AI对HBM高带宽内存的依赖,提升大模型推理性能,完善国内AI生态。HBM作为3D堆叠DRAM方案,具有高带宽、低延迟等优势,是高端AI芯片标配,但面临产能紧张和美国出口限制。国内厂商正探索Chiplet封装、低参数优化等替代方案。

  • Custouch市场易AI技术入选Topdigital2025全球AI营销图谱

    《TopDigital2025全球AI营销图谱》近日发布,Custouch市场易入选"内容智能生成"板块。该图谱为AI技术重构营销提供全链路产业地图,整合企业官网、学术报告、专利库等多维度信息。Custouch凭借AI技术在B2B营销领域的创新应用入选,其智能解决方案能有效满足企业实际需求。作为数字营销技术服务商,Custouch已为300+国际头部企业提供一站式营销管理体系,涵盖内容、活动、线索等全流程,助力企业实现高质量增长。此次入选既是对其AI成果的肯定,也是对其未来发展的激励。

  • CleanMyMac上线云存储清理功能

    CleanMyMac推出全新"云存储清理"功能,支持iCloud和OneDrive两大主流云服务。该功能提供统一可视化界面,可批量删除云端和本地的重复文件,或仅解除同步保留云端文件。通过滚动列表和可视化图谱两种模式,帮助用户高效管理存储空间。所有操作均在本地完成,确保数据安全。软件提供7天免费试用,并推出Basic基础版和Plus高级版两种套餐,现有用户可免费升级体验Plus全部功能。未来计划支持腾讯云、百度云等中国本土云平台,持续优化Mac存储管理体验。

  • WEEX亮相里约热内卢Blockchain.RIO:以社区为核心驱动全球化进程

    拉美地区Web3盛会Blockchain.RIO在巴西里约热内卢成功举办,WEEX交易所作为铂金赞助商亮相。WEEX首席运营官Andrew发表主题演讲,重点介绍WXT经济设计理念和平台生态发展战略,强调"流动性建设与平台生态发展"的运营思路。此次活动标志着WEEX全球化战略在拉美市场的深化推进,通过"技术稳健、社区参与、合规发展"三位一体策略构建品牌竞争力。WEEX将持续强化本地�

  • AI日报:智谱视觉推理模型GLM-4.5V开源;达摩院开源三项具身智能核心技术;360智脑推出Light-IF系列模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • 2025年AI时代SCRM系统选型推荐:企业销售管理客户运营痛点深度分析,数字化系统选谁家?

    文章主要介绍了2025年企业数字化转型面临的挑战及尘锋SCRM解决方案。当前企业数字化过程中普遍存在业务数据零散、系统难用等问题,导致效率低下。尘锋SCRM作为行业领先的智能客户运营平台,通过AI赋能覆盖获客、销售转化、客户运营等全业务流程,提供自动化线索对接、销售SOP、智能工单等功能,已帮助医疗、汽车、家居等行业客户提升线索利用率60%、转化率30%。其创新的一键拉群等功能显著减轻运营负担,并通过多项安全认证确保数据安全。文章建议企业选择真正适配业务需求的数字化工具,以尘锋SCRM为例说明优质SCRM系统能有效推动企业高效增长。

  • Checkout.com携手Visa推出发卡业务 (Card Issuing)

    Checkout.com与Visa达成战略合作,在英国及欧洲地区推出全方位发卡业务。通过Visa全球支付网络,商户可即时获取收款资金用于支付供应商款项,显著提升资金使用效率。该合作特别针对旅游业企业,解决其支付流程分散、资金周转慢的痛点。Checkout.com每年处理数千亿交易的技术能力与Visa网络结合,帮助商户消除预存资金需求,优化现金流管理。双方表示这将大幅提升欧洲商户运营效率,释放增长潜力。

  • 从数字枷锁到智能伙伴:AI Agent正在系统性重构CRM价值逻辑

    微软CEO纳德拉提出AI Agent将彻底改变SaaS行业,以Copilot Workspace为代表的新型交互方式正在重塑CRM领域。Salesforce和销售易等企业已推出AI Agent产品,通过自然语言交互优化销售流程,解决传统CRM数据录入繁琐、决策滞后等痛点。AI Agent能自动分析客户数据、生成拜访计划、实时转录会议内容,并精准识别增量客户,将销售效率提升10倍以上。腾讯投资的销售易NeoAgent平台已上线渠道助理、营销Agent等产品,通过大模型与业务系统深度整合,实现从"流程固化"到"智能协同"的转变。这场变革标志着SaaS 2.0时代的到来——软件不再是工具,而是能理解意图、主动规划的数字员工。未来商业竞争的核心,将转向数据资产厚度与场景落地的精准度。

  • 报价345亿美元!AI新贵公司计划收购谷歌旗下Chrome浏览器

    美国AI搜索新贵Perplexity正考虑以高达345亿美元的全现金方式,收购谷歌旗下拥有逾30亿用户的Chrome浏览器。 成立仅三年、总部位于旧金山的Perplexity(由阿拉温德斯里尼瓦斯等人创立),专注于生成式AI搜索引擎,直接挑战谷歌和微软必应。 截至2024年4月,其月活跃用户约1500万,主要依靠付费订阅盈利。这家初创公司已从英伟达、软银集团等巨头筹集约10亿美元融资,最新估值

今日大家都在搜的词: