首页 > 业界 > 关键词  > AI推理最新资讯  > 正文

华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源

2025-08-13 09:49 · 稿源: 快科技

快科技8月13日讯,据媒体报道,在2025金融AI推理应用落地与发展论坛上,华为推出了AI推理创新技术UCM(推理记忆数据管理器)。此技术被业内看作是可能重塑国内AI推理格局的关键进展。

UCM技术的关键在于其先进的KV Cache系统,借助融合多种缓存加速算法工具以及精细的分级管理策略,高效应对推理过程中生成的大量记忆数据。这产生了诸多明显优势:有效拓宽上下文窗口,保证推理过程具备高吞吐量与低延迟,并显著降低每个Token的推理成本。

特别关键的是,UCM技术有希望缓解当前因HBM(高带宽内存)资源不足致使的任务停滞与响应延迟问题,为AI应用提供更顺畅的体验,进而减少行业对HBM的过度依赖。

此次论坛不仅是UCM技术的首次露面,华为还宣布会与中国银联携手,共同发布双方在AI推理领域的最新应用成果。论坛还邀请了信通院、清华大学、科大讯飞等机构的专家,分享他们在优化大模型推理速度以及提升用户体验方面的前沿经验。

华为数据存储产品线副总裁樊杰在演讲中着重强调了高质量行业数据与高性能存储对AI发展的重要性。他表示,未来的AI突破将极大依赖于此,高性能AI存储系统能把数据加载时间从数小时缩短至几分钟,同时让算力集群的效率实现翻倍。

华为打算在2025年9月正式开源UCM技术,首发平台是魔擎社区。后续,华为会逐步把该技术贡献给业界主流的推理引擎社区,并向所有采用“共享一切”(Share Everything) 架构的存储厂商及生态伙伴开放共享。

举报

  • 相关推荐
  • 三星Micro RGB色彩技术亮相进博,智绘AI家电新视界

    三星在第八届进博会上紧扣AI浪潮,展示了显示技术、智能家电、半导体及物联网等领域的前沿成果。重点推出全球首款Micro RGB电视,融合微米级LED创新显示与AI功能,实现精准控光、更高亮度和真实色彩;同时展出144英寸Micro LED及纤薄折叠手机,体现从超大屏到移动显示的技术实力。全线产品集成Vision AI,通过影像增强、自适应音效等技术优化视听体验,并借助Galaxy AI提供个性化服务,强化在移动AI领域的领先地位。

  • 坚定研发 GMCC美芝以原创性技术打造空调好“心脏”

    GMCC美芝15槽10极变频转子式压缩机自2025年投产以来,凭借静音、节能等革命性优势获行业认可。其应用三大原创技术:极致静音技术通过创新结构实现6Hz无异音,噪声较行业标杆再降5dB(A);宽域节能技术采用高效电机及流道优化,低频能效提升2%;高质智能制造技术引入自动化工艺,生产效率提升42%。这些突破彰显美芝作为全球空调压缩机领导品牌的技术实力,推动产业从规模领先迈向技术领先。

  • DTC2025|TCL华星印刷OLED小尺寸突破,全产业技术创新布局

    2025年11月14日,TCL华星在苏州举办全球显示生态大会(DTC2025),以“臻图视界,印韵生辉”为主题。大会展示了AI技术成果及多款LCD、OLED、MLED新品,发布《视觉健康白皮书2.0》。TCL华星强调AI与显示深度融合,推出“AI五星架构”及星智X-Intelligence 3.0大模型,推动产业升级。重点技术包括印刷OLED、Micro LED等创新产品,如全球首款Real Stripe RGB OLED手机显示。公司致力于通过绿色制造和视觉健康技术,打造可持续显示生态,与合作伙伴共促产业转型。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 百度搜索推出“百度猎户座”AI引擎,涵盖基座模型、搜索AI API、 MCP、垂类优势能力

    2025年11月13日,百度发布“百度猎户座”AI引擎,全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力,基于多智能体架构统一连接信息、工具、服务与模型,融合搜索技术优势与全网MCP生态资源。即日起对外开放,支持企业快速接入打造专属AI应用。同时,文心助手上线个性化记忆功能,视频生成推出“参考生成”玩法,AI短剧创作平台免费提供超30万部IP资源及全流程工具。

  • EBC金融集团携手牛津:洞见经济本质实现投资认知突围

    EBC金融集团与牛津大学经济系将于2025年11月11日联合举办第三期“经济学家都干了什么”系列研讨会。本期主题聚焦复杂时代的金融素养培养,旨在帮助投资者建立牛津经济学思维,弥合公众与专家间的认知鸿沟。研讨会将引入“解释-参与-教育”三维框架,结合牛津教授的前沿研究与EBC CEO的实战经验,探讨央行沟通策略及有效经济教育模式,助力提升市场洞察力与决策能力。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • 科普 | 读懂HBM和DRAM,才懂AI算力未来

    在AI算力需求激增的背景下,存储芯片成为决定计算性能的关键。文章重点分析了三大易失性存储技术:SRAM凭借高速读写特性在CPU缓存中不可替代;DRAM作为数字世界的“主内存”,在容量与速度间实现平衡;HBM则通过3D堆叠架构革命性提升带宽,突破AI训练中的“内存墙”瓶颈。当前HBM需求爆发式增长,预计2025年市场规模将达340亿美元。中国企业在DRAM领域逐步突破,并开始布局HBM技术,正通过持续技术积累提升在全球半导体生态中的地位。

  • Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

    小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。

  • “itc智能云会议系统”通过科技创新与品牌建设成果评价,关键技术达国内领先水平!

    ITC保伦股份联合多家顶尖机构研发的“智能高效云会务管理系统”通过专家评审鉴定。该系统以云会务为基础,融合无纸化会议、远程视频会议等功能,打造全方位沉浸式智慧会议新生态。项目在云会议系统关键技术取得突破,达国内领先水平,已获29项国家发明专利、22项软件著作权,形成系列产品并实现规模化应用。专家认为该成果将推动政企、金融、医疗等行业数字化转型,提供更智能便捷的会议体验。

今日大家都在搜的词: