华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

2025-08-12 15:37 · 来源： AIbase基地

8月12日，华为将在 2025金融AI推理应用落地与发展论坛上发布突破性 AI 推理创新技术 UCM（推理记忆数据管理器）。该技术有望降低中国 AI 推理对 HBM（高带宽内存）的依赖，并显著提升国内大模型推理性能。

UCM 以 KV Cache 为核心，融合多类型缓存加速算法工具，通过分级管理推理过程中产生的记忆数据，扩大上下文窗口，实现高吞吐、低时延的推理体验，并降低每 Token 的推理成本。这一方案可缓解 HBM 资源不足带来的任务卡顿与响应延迟问题。

大模型元宇宙 (2)

在此次论坛上，华为将与中国银联共同发布 AI 推理最新应用成果。信通院、清华大学、科大讯飞等机构专家也将分享大模型推理加速与体验优化的实践。华为数据存储产品线副总裁樊杰表示，未来 AI 突破将高度依赖高质量行业数据的释放，高性能 AI 存储可将数据加载时间从小时级缩短至分钟级，使算力集群效率从30% 提升至60%。

业内分析认为，UCM 的推出正值 AI 产业从“追求模型能力极限”转向“追求推理体验最优化”的关键节点，推理体验已成为衡量 AI 商业价值的重要标准。长城证券指出，随着大模型能力持续提升与商业场景扩展，算力及产业链公司有望迎来新的发展机遇。

相关推荐

云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

云天励飞近日加入OISA生态，携手产业伙伴共建国产AI芯片互联体系，为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系，旨在打造全向、对等、智能的互联新范式，解决智算集群内存互访难题，为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累，将依托“算力积木”架构的模块化优势，在大规模推理集群中实现高效互联，助力突破万级MoE大模型推理瓶颈，推动国产算力生态发展。

云天励飞 OISA生态 AI芯片互联
硬核创新比肩华为，Momenta首度荣膺WNEVC 2025全球新能源创新技术

9月27日，2025世界新能源汽车大会在海口开幕。会上，Momenta凭借其全场景量产辅助驾驶方案Mpilot，荣获“全球新能源汽车创新技术”奖项。该方案基于全国首个量产“端到端大模型”，实现全场景智能驾驶，覆盖复杂道路环境，极大减轻驾驶员负担。目前，Momenta合作车型超160款，覆盖奔驰、宝马、丰田等全球主流车企。未来，公司将持续推动无人驾驶技术规模化落地，助力智能出行产业发展。

新能源汽车 Momenta 辅助驾驶
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化
荐AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

AI日报今日聚焦多项技术突破：可灵AI推出图片转视频功能，腾讯混元SRPO技术提升图像真实感，IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban，DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能，抖音上线“AI求真”辟谣工具，通用DeepResearch开源模型性能超越国际知名模型。

AI日报数字人视频生成
荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
深度解读丨悠然无界大模型BLM-1.0：跨空间、跨任务与跨本体泛化的里程碑

9月28日，悠然大模型BLM-1.0完成迭代升级并全面开源。该模型突破数字与物理世界壁垒，实现跨空间迁移、跨任务学习与跨本体泛化能力，以统一模型覆盖多种机器人平台。在空间理解、推理与执行评估中综合超越同规模SOTA方法，支持工业制造、智慧城市等场景应用，推动空间智能生态共建。

悠然无界大模型 BLM-1.0 开源模型权重
从心出发，新品与新技术双重进化，技嘉2025线下产品发布会强势来袭

技嘉科技将于2025年9月17日在上海举办年度产品发布会，主题为“从心出发，我们的主张”。本次发布会聚焦解决消费者刚需问题，推出新一代X870E X3D系列主板，搭载X3D Turbo Mode 2.0智能释放CPU性能，并展示全新D5黑科技2.0一键提升内存带宽。现场还将有世界超频冠军HiCookie进行液氮极限超频演示，以及快易拆设计、纯白美学设计和AI TOP系列产品线展示，全方位呈现技嘉在硬件性能与用户体验上的创新突破。

技嘉发布会 X3D新品 AI应用落地
考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

9月28日，在成都举行的“2025天府人工智能产业生态大会”上，考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源，同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略，推动空间智能产业生态共建。BLM-1.0突破传统模型局限，具备跨空间、跨任务、跨本体的“三跨”统一能力，在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互，实现工业运维、安装巡检等场景的全程自动化与智能辅助，显著提升效率并降低成本。

人工智能开源大模型空间智能
易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

9月12日，易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”，成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出，易鑫以AI为核心驱动力，通过自研大模型“智鑫多维”等技术，显著提升风控水平与融资通过率，推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构，服务覆盖牧民、基层员工等多元群体，体现技术普惠价值。未来将持续加大科技创新投入，深化国内普惠金融服务，并探索技术出海，助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可，更反映出行业正加速拥抱智能化变革。

AI应用汽车金融金融科技
PICO × 英特尔× 央美共探 AI 艺术新生态：技术重塑创作、教育与产业未来

AI与艺术融合正加速发展：AI重塑设计流程，使创作者更专注美学思辨；三维重建技术以毫米级精度改写传统工艺，为文物复原提供科学依据；虚拟数字展厅凭借沉浸式体验与互动，为策展提供新可能。PICO联合中央美院等机构举办论坛，探讨AI赋能下的艺术生态。英特尔推出酷睿Ultra处理器，支持智能抠像、文生图等功能，提升创作效率。未来AI将推动艺术教育转型，培养复合型

AI艺术三维重建虚拟数字展厅

今日大家都在搜的词：

热文

3 天
7天

华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

硬核创新比肩华为，Momenta首度荣膺WNEVC 2025全球新能源创新技术

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

荐AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

深度解读丨悠然无界大模型BLM-1.0：跨空间、跨任务与跨本体泛化的里程碑

从心出发，新品与新技术双重进化，技嘉2025线下产品发布会强势来袭

考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

PICO × 英特尔× 央美共探 AI 艺术新生态：技术重塑创作、教育与产业未来

今日大家都在搜的词：

热文

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

马斯克个人财富达5000亿美元特斯拉市值飙升助力

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

苹果iOS18.7.1正式版更新发布重要安全修复

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

罗永浩替小米说公道话：海报小字是行业陋习

iPhone调休闹钟上热搜苹果客服回应：需手动设置

腾讯QQ闪传功能上线支持单文件最大10GB传输

站长商机