首页 > 业界 > 关键词  > 正文

华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖

2025-08-10 16:01 · 稿源: 快科技

快科技8月10日消息,据国内媒体报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。

据透露,这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。

华为0000

HBM(High Bandwidth Memory,高带宽内存)是一种基于3D堆叠技术的先进DRAM解决方案,多层DRAM芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势。

AI推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型,可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM可显著提升响应速度。

当下,HBM已成为高端AI芯片的标配,训练侧渗透率接近100%,推理侧随模型复杂化加速普及。

然而,其产能紧张和美国出口限制倒逼国内厂商探索Chiplet封装、低参数模型优化等替代方案。

举报

  • 相关推荐
  • 微算法科技MLGO突破性的监督量子分类器:纠缠辅助训练算法为量子机器学习开辟新天地

    量子机器学习(QML)正成为计算科学领域的研究热点。传统机器学习面临计算瓶颈和数据处理的局限性,而量子计算凭借其并行处理能力展现出巨大潜力。微算科技提出基于量子纠缠的新型训练算法,通过量子叠加态同时处理多个训练样本,大幅提升训练效率。该算法利用贝尔不等式构建成本函数,能同时优化多个样本误差,避免传统方法中的局部最优问题。量子分类器不仅能处理单一样本信息,还能在量子态中对多个样本进行并行处理。尽管量子计算仍面临硬件稳定性等挑战,但随着技术进步,QML有望在复杂分类任务中展现革命性优势,成为未来科技创新的重要方向。

  • 浙大“卓越中心”发布两项成果突破,为航空航天科学计算注入新动能

    浙江大学与华为合作在航空航天领域取得两项重要突破:夏一帆团队基于昇腾平台开发新型隐式神经网络算法,用于微分方程求解和流场预测,相比传统方法精度提升10%以上;张继发团队基于鲲鹏平台开发高效可变飞行器流动仿真软件,运行速度提升30%-50%。两项成果已应用于航空航天工程实践,为飞行器研发提供关键数据支持,展现了"算力+算法"融合创新的重大价值。

  • 北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元

    北京大学张牧涵团队在昇腾算力支持下,研发出一套高效大模型训练推理架构,实现百万tokens输入成本低至1元。该成果包含三项关键技术:1)通过分离注意力头中的位置与非位置信息,仅用3%位置信息即可维持模型性能;2)采用联合KV低秩压缩方法,仅保留12.5%的KV Cache;3)基于昇腾硬件并行计算能力,实现Recurrent Decoding技术提升训练数据利用率。该架构显著降低AI大模型应用成本,验证了昇腾算力平台支撑尖端科研的实力。

  • 再生塑料只能降级用?海尔:纯度99.9%堪比新料

    夏季饮料消费旺季产生大量废弃PET塑料瓶,我国94%以上PET瓶被有效回收,但多数仅降级用于垃圾桶、农用塑料桶等低端产品。塑料回收利用面临"品质鸿沟",主要因塑料种类复杂、分选技术不足导致再生料性能下降。海尔智家通过创新技术实现99.9%高纯度再生塑料生产,性能接近新料,已应用于汽车、日化等领域。2022-2024年我国废塑料回收量从1800万吨增至1906万吨,推动再生塑料高值化利用成为循环经济关键。技术创新证明再生塑料完全能达到新料标准,打破"降级使用"固有认知,为循环经济发展提供新路径。(140字)

  • 为什么建议每天最少走7000步 研究发现能降低死亡风险

    据媒体报道,澳大利亚一所大学的新研究表明,每天步行7000步能显著降低健康和死亡风险,全因死亡风险降低47%,而且对心脏病、癌症和痴呆症等均有额外保护。 据了解,长期坚持走路健身可以提高身体心肺耐力水平,从而促进慢性病防治和降低死亡风险,高血压、糖尿病等患者也可以通过适度走路来缓解病症。 需要注意的是,错误的走路姿势会造成损伤,我们在走路过程

  • 全球销量增20%,份额净增1.2pct!海尔空调郑州发布新成果

    今年空调市场受高温和政策刺激持续火热,但行业面临流量枯竭、内卷和高成本挑战。海尔空调实现销量与销售额双增长,安装量增长超50%,线上线下份额均提升。其高端空气解决方案品牌卡萨帝收入增长超50%,空气类产品销量激增120%。海尔发布三大突破性成果,推出"性能神机"云溪空调,解决极端高温制冷和冬季制热难题,APF值达6.03,省电40.3%。同时发布行业首个AI空调团体标准,定义真智能界限。海尔还推出"一机三系统"方案,整合制冷、新风和湿度调节功能,以及"8小时极速换新"服务承诺,重新定义家庭舒适呼吸体验。

  • 《2025快手短剧白皮书》发布:快手短剧日活用户突破3亿,发力“短剧+AI”

    2025年暑期短剧市场持续爆发,快手星芒短剧率先开启"档期化运营",计划推出20余部精品短剧,包括《黑桃四姐妹》《进击的潘叔》《她不是敌人》等爆款作品。数据显示,潘长江主演的《进击的潘叔》播放量破3亿,其他多部作品播放量也突破亿级。快手短剧日活跃用户超3亿,2024年7月重度用户规模达1.46亿,同比增长55.3%。AI技术赋能创作突破题材局限,《山海奇镜之劈波斩浪》《新世界加载中》等AIGC剧集表现亮眼,全球播放量分别达4.3亿和13.7亿。平台商业化成效显著,2024年合作剧目从29部跃升至135部,增长率达365%,第四季度商业化消费额同比增长300%。付费与广告变现规模持续扩大,25家品牌客户单日消费峰值突破百万元,2025年春节档广告消费峰值突破3000万元。快手短剧通过"技术驱动+生态共建"模式,激活3亿用户消费势能,实现内容品质与商业模式全方位升级。

  • 苹果预计明年发布个性化Siri 库克称进展良好

    今日,苹果公司发布2025财年第三季度财报。 报告期内,苹果总营收为940.36亿美元,较上年同期的857.77亿美元增长10%;净利润为234.34亿美元,较上年同期的214.48亿美元增长9%。 大中华区收入为153.69亿美元,较上年同期的147.28亿美元增长4%,结束了前两个季度的下滑,恢复增长。 据悉,苹果CEO库克在财报电话会议上透露了诸多有趣的信息,明确表达了苹果在AI领域的雄心。 他�

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • 1999元 华为智能门锁2悦享版发布:AI掌静脉识别、全新算力芯片

    今日,华为智能门锁2悦享版发布,目前已在华为商城、授权电商开启预售,售价1999元,首发到手价1799元,将于8月18日10:08正式开售。 华为智能门锁2悦享版支持AI掌静脉识别,采用高清近红外成像技术,可采集手掌深层不易被窃取的静脉图像,无需担心身高、指纹不清晰问题。 门锁搭载新一代NPU芯片,算力提升1.5倍,识别能力更强大。 除掌静脉外,华为智能门锁2悦享版还�