首页 > 业界 > 关键词  > 华为最新资讯  > 正文

华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖

2025-08-10 16:01 · 稿源: 快科技

快科技8月10日讯,据国内媒体讯息,华为会于8月12日在2025金融AI推理应用落地与发展论坛上,公布AI推理领域的重大技术成果。

据消息称,此项成果或许能够减少中国AI推理对HBM(高带宽内存)技术的依赖程度,提高国内AI大模型推理性能,完善中国AI推理生态的关键构成部分。

华为0000

HBM(High Bandwidth Memory,即高带宽内存)是一种借助3D堆叠技术的先进DRAM解决方案,多层DRAM芯片呈垂直集成状态,极大地提高了数据传输效率。具备超高带宽、低延迟、高容量密度以及高能效比等优点。

AI推理需要经常调用海量的模型参数(比如千亿级权重)以及实时输入数据。HBM的高带宽和大容量能让GPU直接访问完整模型,可防止传统DDR内存因带宽不够致使的算力闲置。对于千亿参数以上的大模型,HBM能够显著加快响应速度。

目前,HBM已然成为高端AI芯片的标准配置,训练侧渗透率近乎100%,推理侧随着模型的复杂化而加速普及。

然而,其产能紧张以及美国的出口限制促使国内厂商探寻Chiplet封装、低参数模型优化等替代方案。

举报

  • 相关推荐
  • 华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

    9月18日,华为全联接大会2025期间举办AI城市峰会,聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构,通过智能云底座、安全保障体系及统一平台,推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例,展示AI在政务、城市管理及工业领域的应用成效,并呼吁各方共建AI城市生态,加速数字化进程。

  • 宜享花依托AI与大数据技术,推动消费金融合规创新与服务提质

    宜人智科旗下品牌宜享花以人工智能与大数据技术为核心驱动力,构建覆盖全链路的一体化智能服务体系。平台在严格合规框架下,深度融合金融机构与多元场景资源,为消费者提供精准、安全的金融支持,并通过科技创新持续优化风控能力与服务体验。宜享花高度重视合规经营,建立覆盖业务全流程的个人信息保护机制,自主研发“Hawkeye反欺诈管理系统”有效识别并拦截欺诈行为。同时,平台发布《消费者权益保护2024年度报告》,建立六大消保评审维度,强化事前审查与专项检查机制。通过AI技术打造高效、智能的客户服务体系,累计提供智能客服超490万次,智能客服分流率达52%。未来,宜享花将持续深化科技应用,筑牢智能风控防线,完善消费者权益保护,为经济高质量发展注入科技金融新动能。

  • 云天励飞“算力积木”联手OISA,突破万亿级MoE大模型推理集群的Scale up瓶颈

    云天励飞近日加入OISA生态,携手产业伙伴共建国产AI芯片互联体系,为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系,旨在打造全向、对等、智能的互联新范式,解决智算集群内存互访难题,为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累,将依托“算力积木”架构的模块化优势,在大规模推理集群中实现高效互联,助力突破万级MoE大模型推理瓶颈,推动国产算力生态发展。

  • PICO × 英特尔× 央美共探 AI 艺术新生态:技术重塑创作、教育与产业未来

    AI与艺术融合正加速发展:AI重塑设计流程,使创作者更专注美学思辨;三维重建技术以毫米级精度改写传统工艺,为文物复原提供科学依据;虚拟数字展厅凭借沉浸式体验与互动,为策展提供新可能。PICO联合中央美院等机构举办论坛,探讨AI赋能下的艺术生态。英特尔推出酷睿Ultra处理器,支持智能抠像、文生图等功能,提升创作效率。未来AI将推动艺术教育转型,培养复合型

  • GMIF2025:慧荣科技展示从云端到边缘的AI存储主控技术

    9月25日,第四届GMIF2025创新峰会在深圳湾万丽酒店召开,聚焦“AI应用,创新赋能”主题。慧荣科技总经理苟嘉章发表演讲,指出AI推动存储架构从“分层存储”向“存算融合”演进,存储成为AI计算关键环节。峰会展示了慧荣在数据中心、边缘与AI PC、车载嵌入式等领域的最新存储解决方案,并呼吁产业链协同创新,应对2026年可能出现的存储芯片紧缺局面。慧荣凭借主控芯片技术优势荣获“杰出主控技术创新奖”。

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • 上云好时机!华为云Flexus OBS化繁为简解锁存储管理新体验

    在AI热潮与企业数字化转型加速的背景下,华为云Flexus对象存储(OBS)凭借高效、稳定、安全、低成本的优势,成为企业构建海量非结构化数据存储体系的关键。它支持弹性扩展与按需付费,避免资源浪费,并通过多副本、纠删码等机制保障数据持久性。Flexus OBS还具备高并发处理能力,适配AI训练、音视频平台等场景,与华为云其他服务深度协同,实现“即存即用”。目前,华为云828 B2B企业节正推出优惠活动,助力企业降本增效。

  • 华为云:做厚算力“黑土地”,成就行业AI先锋

    华为全联接大会2025上,华为云发布多项AI创新成果,包括CloudMatrix 384昇腾AI云服务全面上线,支持超大规模AI集群,算力提升显著。推出EMS弹性内存存储服务,降低大模型对话延迟。同时,华为云在贵州、内蒙古等地部署全液冷AI数据中心,PUE低至1.1,实现高效智能运维。盘古大模型已在30多个行业、500多个场景落地,覆盖政务、金融、制造等领域。华为还推出企业级Agent平台Versatile,提升开发效率,并发布R2C协议,推动云端一体化机器人发展。此外,华为云通过全球存算网、数据赋能及一站式AI开发平台,助力企业实现智能化转型。

  • 硬核创新比肩华为,Momenta首度荣膺WNEVC 2025全球新能源创新技术

    9月27日,2025世界新能源汽车大会在海口开幕。会上,Momenta凭借其全场景量产辅助驾驶方案Mpilot,荣获“全球新能源汽车创新技术”奖项。该方案基于全国首个量产“端到端大模型”,实现全场景智能驾驶,覆盖复杂道路环境,极大减轻驾驶员负担。目前,Momenta合作车型超160款,覆盖奔驰、宝马、丰田等全球主流车企。未来,公司将持续推动无人驾驶技术规模化落地,助力智能出行产业发展。

  • 腾讯云大数据TBDS重磅升级,助力金融行业构建Data+AI一体化数智新范式

    腾讯云在腾讯全球数字生态大会上宣布,其大数据平台TBDS面向AI时代完成重磅升级。此次升级聚焦“数据与AI一体化”,旨在为金融机构提供兼具数据工程与数据科学能力的综合平台,打破传统数据处理与智能应用间的壁垒。新TBDS通过多模湖仓平台、WeData数智开发治理平台及DataAgent数据智能即服务构成核心架构,实现数据存储、管理、开发、治理与运维全面智能化。平台支持多模数据统一汇聚、异构计算负载调度,并显著提升数据开发到模型上线的全链路效率。在金融场景中,新TBDS已应用于信贷自动审批等业务,帮助机构提质增效。未来,腾讯云TBDS将持续发挥专业化与智能化优势,助力金融行业加速数字化转型。

今日大家都在搜的词: