首页 > 业界 > 关键词  > 正文

华为提出全新压缩算法:节省70%内存占用

2025-01-24 21:31 · 稿源: 快科技

华为AI算法团队在人工智能领域取得重大进展,成功开发出创新的大模型KV Cache压缩算法“RazorAttention”。

该算法表现出色,可节省高达70%的大模型推理内存占用,为AI大模型的高效运行奠定基础。

RazorAttention算法已发表论文,并被国际顶级深度学习会议ICLR 2025收录。华为指出,该算法是业界首次基于Attention可解释性开发的离线静态KV Cache压缩算法。

通过检索头机制,RazorAttention算法确保上下文中的关键信息不丢失,实现了高精度(误差低于1%)和高效压缩。其压缩率可达70%,显著降低了AI大模型推理成本。

目前,RazorAttention算法已集成至昇腾MindIE/MindStudio产品中,支持主流8K~1M长序列KV Cache压缩,并可在32K以上场景中提升20%的吞吐量。

举报

  • 相关推荐
  • 史上最薄Mate!华为Mate 70 Air要用等深四曲屏、最高16GB内存

    华为Mate 70 Air预计将于本月登场,该机将是史上最薄Mate。 今日,数码博主定焦数码”曝光了一台又薄又大的机器”,从微博内容和网友评论来看,该机正是华为Mate 70 Air。 该博主透露,华为Mate 70 Air将采用等深四曲屏设计,最高提供16GB运行内存版本,出厂预装鸿蒙OS 5.1操作系统,支持升级最新的鸿蒙OS 6。

  • 华为Mate70 Air官宣今日开启预售

    华为Mate70 Air于11月6日正式发布,10:08开启预售。该机主打轻薄设计,机身厚度仅6.x毫米,为Mate系列最薄直板机。配备居中大圆镜头模组,后置四摄包括5000万主摄、800万超广角微距、1200万长焦防抖及150万光谱镜头,支持多种拍摄场景。屏幕采用7英寸临境大屏,分辨率2760*1320,支持AI+HDR显示。通信方面支持双向北斗消息、Wi-Fi7等功能,搭载麒麟9020系列处理器,提供流畅性能。拥有曜金黑、羽衣白、金丝银锦三款配色,保留实体SIM卡槽,预计将引发市场热潮。

  • 科大讯飞“AI+文旅”产品全新升级

    在2025科大讯飞全球1024开发者节期间,"AI+文旅"产品升级发布,展示AI如何让文旅体验从"到此一游"升级为"深度体验"。重点包括:数字人技术让李白"讲解"庐山瀑布,虚拟人交互平台支持一键定制景区专属形象;讯飞翻译机2.0支持80种外语实时对话;AI伴游APP可生成个性化行程。同时,AI开发者大赛优秀团队展示了三维重建、互动短剧、MR博物馆等创新实践,体现AI在智慧文旅全流程的应用潜力。

  • 他提前马斯克7年就提出了硅基生命的概念

    中国创业者司马华鹏于2017年首次系统提出“硅基生命”概念,比马斯克公开讨论类似理念早七年。他构建了完整理论框架,强调硅基生命与碳基生命的“共生进化”关系,体现东方“天人合一”哲学。相比之下,马斯克2024年提出的概念更侧重“竞争进化”与风险意识。七年来,司马华鹏带领团队专注技术实践,从数字人研发到多模态AI系统,逐步推出拟人化数字生命体。尽管其贡献因语言壁垒和低调作风未被国际广泛认知,但技术积累与东方智慧正日益获得认可。

  • 小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

    小米14 Pro系列10月29日迎来副屏重大更新,新增动态大头贴、实时对话翻译功能,并上线5款动态壁纸及2款复古风格掌机游戏。动态大头贴支持通过副屏拍摄并应用模板增添趣味,对话翻译实现正屏输入与副屏多语言同步显示。壁纸库新增萌系与科技自然主题,掌机游戏搭配专属保护壳提升沉浸体验。此次更新分阶段推送,预计11月中旬覆盖全部用户,持续拓展副屏交互场景。

  • 华为Mate 70 Air配置价格公布:可选CPU 售价4199起

    华为Mate70 Air于11月6日10:08开启预售,提供麒麟9020B和9020A两款CPU版本,价格从4199元至5199元。机身仅6.6mm厚、208g重,配备7英寸OLED临境大屏,支持120Hz刷新率。影像系统包括后置四摄组合与前置1070万超广角镜头,内置6500mAh电池与66W快充。支持双向北斗卫星消息、Wi-Fi7,预装HarmonyOS 5.1系统。凭借轻薄设计、可选CPU及全面配置,有望引发市场关注。

  • 鸿蒙智行:全新问界M7上市36天交付破20000台

    鸿蒙智行全新问界M7自9月23日上市以来表现强劲:起售价27.98万元,24小时订单破4万台,国庆假期收获1.5万大定。上市21天交付量超1万台,36天突破2万台。11月将启动产能爬坡,月产能提升至2-3万台。针对购置税政策疑虑,推出跨年补贴方案,最高补1.5万元。产品全面升级:轴距加长210mm至3030mm,搭载16.1英寸3K中控屏、零重力座椅、后排娱乐屏等配置。底盘采用全铝合金前双叉臂+后五连杆,配备空气悬架与CDC减震器。全系搭载华为乾崑ADS 4.0辅助驾驶系统,Pro版首发舱内激光视觉,提升主动安全能力。

  • 微算法科技(NASDAQ MLGO):以隐私计算区块链筑牢多方安全计算(MPC)安全防线

    微算科技开发的隐私计算区块链将区块链技术融入多方安全计算(MPC),构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约,对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护,确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性,在金融、医疗、政务等领域实现跨主体数据安全协作,释放数据价值。

  • 安卓性能小平板!全新联想拯救者Y700核心规格出炉:第五代骁龙8至尊版、3K屏

    今日,数码博主数码闲聊站”曝光联想拯救者Y700 2026款平板部分核心规格,新品预计2026年上半年发布。 据了解,新款Y700将搭载第五代骁龙8至尊版旗舰芯片,依然是一款主打性能的小尺寸平板。

  • 云数据安全态势感知全新上线,筑牢内外网数据安全防线

    本文系统分析了云上数据安全的核心问题与解决方案。主要挑战包括:数据资产分散难管理、访问溯源成本高、风险定位困难、权限滞留易泄露。解决路径需构建统一安全运营视图,通过资产自动发现、AI敏感数据识别、访问关系可视化实现全面监测,结合多维动态分析提供精准管控建议。最终达成“看得见、管得住、防得准”的安全目标,并满足合规审计要求。

今日大家都在搜的词: