首页 > 业界 > 关键词  > 生成式AI最新资讯  > 正文

性能8.6倍于竞品!高通AI大揭秘:NPU引领四兄弟

2024-03-07 21:05 · 稿源: 快科技

生成式AI变革,催生底层硬件与软件新需求

生成式人工智能(AI)的蓬勃发展,对底层硬件设计软件生态开发提出了更高的要求。尤其是底层硬件和算力,必须与时俱进,为未来发展做好准备。

高通《终端侧生成式AI白皮书》解读

近日,高通发布《通过NPU异构计算开启终端侧生成式AI》白皮书,详细阐述了终端侧生成式AI的发展趋势,以及高通骁龙处理器的多模块异构计算引擎,特别是NPU的设计和优势。

高通异构计算引擎:协同共进

高通采用异构计算引擎策略,由Kryo CPU、Adreno GPU、Hexagon NPU、传感器中枢四大核心模块组成,相互协作。

  • CPU:擅长顺序控制和即时性,适合延时要求高的场景。
  • GPU:擅长高精度格式的并行处理,算力强劲,可运行大规模模型。
  • NPU:擅长标量、向量和张量数学运算,能效高,可实现持续稳定的高峰值性能。
  • 传感器中枢:以极低功耗运行,获取端侧情境信息,增强生成式AI体验。

Hexagon NPU:专为AI推理而生

NPU(神经网络处理器)是为低功耗加速AI推理而打造的硬件模块,其架构随着AI算法、模型和用例的发展而不断演进。

高通Hexagon NPU专注于以低功耗实现持续稳定的高性能AI推理,其优势在于:

  • 系统级解决方案:满足端侧生成式AI的独特需求。
  • 定制设计:针对AI工作负载进行优化,解决瓶颈问题。
  • 快速创新:与AI行业发展方向保持一致,不断演进NPU架构。

Hexagon NPU演进历程

高通从2007年开始研发Hexagon NPU,经历了多次重大升级:

  • 2015年:首个高通AI引擎,支持成像、音频和传感器运算。
  • 2018年:增加Hexagon张量加速器,提升AI性能。
  • 2020年:Hexagon NPU全面升级,成为里程碑转折,在骁龙888及后续三代骁龙8中持续迭代。
  • 2023年:支持LLM和LVM,并支持Transformer,可更好地处理Transformer模型。

第三代骁龙8上的Hexagon NPU

第三代骁龙8集成的Hexagon NPU性能强大,可运行高达100亿参数的模型,在首个token生成速度和每秒生成token速率方面均处于业界领先水平。

此外,Hexagon NPU还引入了微切片推理技术,提升LLM处理能力,可快速处理百川和Llama2等大型模型。

Hexagon NPU性能表现

在实际性能表现中,第三代骁龙8与竞品的对比显示出明显的优势:

  • 鲁大师AIMark V4.3测试:总分超出竞品5.7倍至7.9倍。
  • 安兔兔测试:总分是竞品6.3倍。
  • MLCommon MLPerf推理测试:图像分类、语言理解等子项均保持领先。

在PC端,骁龙X Elite与其他x86架构竞品的对比中,骁龙X Elite在Windows系统下的UL Procyon AI推理测试中大幅领先,总分超出竞品3.4倍至8.6倍。

多模态生成式AI模型

在MWC 2024大会上,高通展示了在终端上运行的多模态生成式AI模型,例如:

  • LLaVA:基于图像输入,回答用户提出的问题。
  • LMM:接受文本和音频输入,进行多轮对话。

高通AI软件栈

除硬件能力外,高通还打造了AI软件栈,支持所有主流AI框架、运行时、编译器和数学库,并提供AI Studio,为开发者提供开发所需的各种工具,提高模型效率。

生成式AI的未来前景

高通认为,AI终端市场的发展才刚刚开始,将对各行各业产生深远影响。生成式AI将让所有人都能充分利用其能力,变革工作、娱乐和生活,就像智能手机的出现让数十亿人能够连接网络一样。

举报

  • 相关推荐
  • 视觉中国「灵感拓展」功能完成生成式AI服务上线登记

    视觉中国旗下中华易美视觉科技公司推出的“灵感拓展”功能已通过江苏省网信办生成式人工智能服务上线登记,正式在VCG.com面向用户开放。该功能基于国产大模型,结合丰富内容资源,通过AI技术为创作者提供灵感和方向,提升创意产出效率与质量。用户可在搜索时获得智能拆解的多维度创作建议,帮助精准定位需求,突破创作瓶颈,优化素材匹配效率。该功能是视觉中国在“AI智能+内容数据+应用场景”战略下的重要成果,目前已面向合作客户开放。

  • 让搜索“一步到位”! 快手提出端到端生成式搜索方案OneSearch

    当前电商平台普遍采用“召回、粗排、精排”级联式搜索架构,但存在商品描述混乱、相关性差、冷启动难等痛点。快手提出业界首个工业级端到端生成式搜索框架OneSearch,集成三大创新模块:关键词增强量化编码(KHQE)提升商品特征建模能力,多视角用户行为序列注入策略实现精准偏好捕捉,偏好感知奖励系统(PARS)优化排序多样性。实际部署后,订单量提升3.22%,买家数增长2.4%,在线推理成本降低75.4%,冷启动场景表现尤为突出。该系统标志着生成式模型在大规模工业场景中首次完整替代传统搜索链路,为电商搜索技术发展指明方向。

  • 维谛(Vertiv)宣布收购生成式AI软件领军企业Waylay NV

    维谛技术(Vertiv)宣布收购比利时生成式AI软件企业Waylay NV,旨在提升关键数字基础设施的运营智能化水平、系统优化能力及服务体验。此次收购将整合Waylay先进的AI驱动自动化平台,帮助客户实现数据中心电力与热管理系统的实时监控、预测性维护和动态优化,应对AI工作负载快速增长的需求。维谛CEO表示,这将加速公司智能化基础设施愿景的实现,助力客户提升运营效率与�

  • 亚马逊入局竞逐AR眼镜行业,Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

    亚马逊正加速布局AR眼镜市场,开发两款产品:面向物流司机的"Amelia"和面向消费者的"Jayhawk"。科技巨头纷纷入局,Meta、谷歌、苹果等均在研发相关产品。中国消费级AR眼镜市场2025年上半年增长显著,销量达26.2万台,同比增长73%。行业预计未来三年规模有望达千亿级别,AR眼镜正从"小众玩具"迈向"大众智能终端"。

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • 华为云:做厚算力“黑土地”,成就行业AI先锋

    华为全联接大会2025上,华为云发布多项AI创新成果,包括CloudMatrix 384昇腾AI云服务全面上线,支持超大规模AI集群,算力提升显著。推出EMS弹性内存存储服务,降低大模型对话延迟。同时,华为云在贵州、内蒙古等地部署全液冷AI数据中心,PUE低至1.1,实现高效智能运维。盘古大模型已在30多个行业、500多个场景落地,覆盖政务、金融、制造等领域。华为还推出企业级Agent平台Versatile,提升开发效率,并发布R2C协议,推动云端一体化机器人发展。此外,华为云通过全球存算网、数据赋能及一站式AI开发平台,助力企业实现智能化转型。

  • 北京航空航天大学 鲲鹏昇腾科教创新孵化中心揭牌,推动中国自主计算生态建设

    9月11日,北京航空航天大学与华为签署合作协议,共同成立“鲲鹏昇腾科教创新孵化中心”。双方将依托华为领先的算力底座,推动人工智能技术创新,深化产教融合,打造自主计算生态。该中心将聚焦前沿课题研究、课程体系建设及人才培养,旨在孵化具有国际影响力的创新成果,为国家战略需求和产业发展注入关键力量。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 基于华为云Token服务的稿定AI上线,一站式解决设计难题

    在视觉时代,AI正重塑设计交付方式。9月19日,华为全联接大会期间,中国商业设计品牌“稿定设计”推出基于华为云Token服务的AI设计平台“稿定AI”,实现从创意激发到成品交付的一站式服务。该平台具备灵感采集、创意激发、视觉精修等能力,通过分层内容生成和无限画布功能,让设计更高效可控。依托华为云算力支持,稿定AI大幅提升多模态大模型生成速度,文生图提速2

  • 人单合一20年:构建AI时代的智能交互生态

    第九届人单合一模式引领论坛暨第二届零距离卓越奖颁奖典礼在北京举行,聚焦“组织智能:构建AI时代的智能交互生态”。论坛汇聚全球400多位专家学者及企业代表,探讨AI时代组织智能的未来。海尔集团董事局主席张瑞敏提出人单合一模式历经20年演进,已从1.0迭代至2.0阶段,实现从零距离到零边界的升级。该模式以人的价值最大化为核心,通过机制创新激发个体创造力,被全球管理学界广泛认可并纳入ISO国际标准。论坛还成立了“零距离卓越联盟”,推动跨行业经验共享与协同创新。

今日大家都在搜的词: