首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

打造 “CPU+” 异构计算平台,Arm 灵活应对各类 AI 工作负载

2024-12-19 11:52 · 稿源: 站长之家用户

对于人工智能 (AI) 而言,任何单一硬件或计算组件都无法成为适合各类工作负载的万 能解决方案。AI 贯穿从云端到边缘侧的整个现代计算领域,为了满足不同的 AI 用例和需求,一个可以灵活使用 CPU、GPU 和 NPU 等不同计算引擎的异构计算平台必不可少。

依托于 Arm CPU 的性能、能效、普及性、易于编程性和灵活性,从小型的嵌入式设备到大型的数据中心,Arm CPU 已经为各种平台上的 AI 加速奠定了基础。

就灵活性而言,这对生态系统大有裨益的三个主要原因是,首先,Arm CPU 可以处理广泛的 AI 推理用例,其中许多用例通常用于数十亿台设备,例如当今的智能手机、云和数据中心。不仅如此,除了推理之外,CPU 还经常用于技术栈中的数据预处理和编排等其他任务。其次,开发者能够在更多种类的数据格式中运行更广泛的软件,而无需构建多个版本的代码。最后,CPU 的灵活性使之成为加速 AI 工作负载的理想工具。

提供多样性和选择,助力行业灵活部署 AI 计算

除了 CPU 产品组合外,Arm 计算平台还包括 GPU 和 NPU 等 AI 加速器技术,许多市场都在将这些技术与 CPU 进行集成。

在移动端领域,Arm 终端计算子系统 (CSS) 包含 Armv9.2 CPU 集群,并与 Arm Immortalis-G925 GPU 集成,可为各种 AI 用例提供加速功能,包括图像分割、对象检测、自然语言处理和语音转文本等用例。在物联网 (IoT) 方面,Arm Ethos-U85 NPU 可与需要加速 AI 性能的基于 Arm Cortex-A 的系统一起设计,例如工厂自动化等场景。

此外,除了 Arm 自己的加速器技术外,合作伙伴借助 Arm 的 CPU 灵活定制具有差异化的芯片解决方案。例如,NVIDIA 用于 AI 基础设施的 Grace Blackwell 和 Grace Hopper 超 级芯片均采用了 Arm CPU 和 NVIDIA 的 AI 加速器技术,从而显著提升 AI 性能。

NVIDIA Grace Blackwell 超 级芯片将 NVIDIA 的 Blackwell GPU 架构与基于 Arm Neoverse 的 Grace CPU 相结合。Arm 独特的产品组合使 NVIDIA 能够进行系统级设计优化,与 NVIDIA H100 GPU 相比,其能耗降低了 25 倍,单个 GPU 性能提高了 30 倍。具体来说,得益于 Arm Neoverse 平台的灵活性,NVIDIA 能够实现自有的高带宽 NVLink 互连技术,并提升 CPU、GPU 和内存之间的数据带宽和延迟。

Arm 致力于通过 Arm 全面设计生态项目,为整个生态系统注入 AI 加速的机遇。通过该生态项目,开发者可以更快访问 Arm CSS 技术,赋能软硬件技术进步,以此驱动 AI 和芯片创新,并加快开发和部署 AI 优化的芯片解决方案。

Arm 架构满足 AI 所需的独特灵活性

Arm CPU 设计所具有灵活性关键在于 Arm 领先的架构。它提供了一个可以与 AI 加速器技术紧密集成的基础平台,并支持从 128 位到 2,048 位的各种向量长度,可以在许多不同的数据点上轻松执行多个神经网络。

Arm 架构的灵活性为整个芯片生态系统提供了多样化的定制机会,Arm 一直致力于帮助合作伙伴更快地构建自己的差异化芯片解决方案。这种独特的灵活性也使 Arm 能够不断进行架构创新,定期推出关键指令和功能来加速 AI 计算,进而惠及整个生态系统,其中包括领先的芯片合作伙伴,以及在 Arm 计算平台上构建应用的 2,000 多万软件开发者等。

这一切始于 Armv7 架构,该架构引入了高 级单指令多数据 (SIMD) 扩展,例如 Neon 技术,这是 Arm 首 次涉足机器学习 (ML) 工作负载。在过去几年中,该架构不断增强,Armv8 中增加了向量点积和矩阵乘法特性,之后在 Armv9 中又引入了 Arm SVE2 和新的 Arm SME 技术,为广泛的生成式 AI 工作负载和用例提高了计算性能并降低了功耗。

与 AI 加速器技术无缝集成

Arm 是 AI 时代的计算平台,推动了持续的架构创新,以满足速度更快、互动性更好和沉浸感更强的 AI 应用的发展。Arm CPU 作为灵活处理 AI 工作负载的异构计算方法中的一部分,可以无缝增强和集成 GPU 和 NPU 等 AI 加速器技术。

Arm CPU 是处理众多 AI 推理工作负载的实用之选,凭借出色的灵活性,它能够与加速器技术无缝集成,打造更强大、更高性能的 AI 功能,准确满足特定用例和计算需求。对于 Arm 的技术合作伙伴而言,出色的灵活性有助于实现丰富的定制选择,使他们能够为 AI 工作负载构建完整的芯片解决方案。


推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 齐鲁起“智”风!销售易AI CRM首秀青岛,助力企业“用上AI、用好AI”

    6月10日,腾讯云城市峰会在青岛举行,腾讯旗下销售易携中国首款AI+CRM产品NeoAgent亮相。该产品基于腾讯混元大模型和DeepSeek开源模型打造,针对制造业产品复杂、销售周期长等特点,助力企业实现从获客到服务的全周期智能化升级。销售易已在山东获得多家龙头企业支持,其AI+CRM解决方案通过实际应用验证,能有效提升企业运营效率和客户体验。未来,销售易将继续深化与腾讯合作,推动AI技术在CRM领域的创新应用,加速行业数字化转型进程。(140字)

  • 腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座

    随着生成式AI技术爆发式增长,AI大模型开始渗透至手机领域。荣耀基于腾讯云TencentOS Server AI的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,在内部场景应用中实现稳定性、可靠性和推理性能的大幅提升。测试显示,使用TACO-LLM后,首Token延迟最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。TACO-LLM通过投机采样技术实现大模型"并行"解码,从根本上解决计算密度问题,大幅提升解码效率。荣耀表示该方案打造了高性能AI底座,提供高吞吐低延迟的优化方案,能无缝整合现有大模型部署方案。腾讯云TACO-LLM针对企业级AI模型私有化部署挑战,专门优化了大语言模型内核运行效率。

  • 618大促京东占据3C数码品类52%销售份额 AI手机、AI电脑等九大AI数码品类热销

    618大促期间,AI数码产品成为消费新宠。京东凭借敏锐市场洞察力,重点运营九大AI数码品类,包括AI手机、电脑、机器人等,相关商品销售额同比增长超50%,占据52%市场份额稳居行业第一。调研显示,超半数消费者将AI功能作为购买决策关键因素,最受关注的是图像处理、智能翻译等实用功能。在智能穿戴领域,健康监测功能最受欢迎。京东凭借精准需求捕捉和高效运营,成为消费者购买AI产品的首选平台,引领这轮由技术驱动的消费升级浪潮。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • 李世石:AI不会“解读”……直觉依然属于人类!

    在技术逐渐超越人的时代,我们必须思考:如何在与科技同行的同时,不失人类本色……

  • 夏厨中暑高发,如何应对厨房“高温”?

    随着全球气候变暖,厨房高温问题日益突出。专家指出,在30-40℃闷热环境中长时间烹饪易引发中暑、呼吸道疾病等健康隐患。厨房不仅是家中热负荷最高的空间,也是空气质量最差的区域。针对这一"亚健康战场",美的推出专为厨房设计的清凉空调,采用无外机嵌入式结构,在高温环境下仍能稳定制冷,并具备防油污设计。该产品解决了传统厨房空调"装不了、用不久、难打理"的痛点,让厨房享有与客厅同等的清凉权利。这不仅是对烹饪环境的革新,更将健康舒适理念融入日常生活,重新定义中国家庭的厨房体验。

  • 天悦康康:AI赋能打造可验证的CBT-I睡眠疗法

    文章介绍了睡眠科学的重要性,指出传统助眠方式依赖主观经验而缺乏数据验证。重点介绍了天悦康康基于世界睡眠医学会认证的CBT-I(失眠认知行为疗法)构建的智能睡眠管理系统,通过智能指环精准监测睡眠数据,结合AI分析提供个性化睡眠改善方案。其创新在于将CBT-I的认知调整(改变错误睡眠观念)和行为训练(建立健康习惯)数字化,形成"数据监测+CBT-I模型+科学干预"的完整闭环。产品还具备睡眠银行、AI伴睡等特色功能,通过可视化数据和正向激励帮助用户养成规律作息,实现睡眠质量的可持续提升。

  • 销售易亮相2025亚马逊云科技峰会,展示AI+CRM驱动业务提效的创新与应用

    2025年6月19日,亚马逊云科技中国峰会在上海世博中心开幕。这场全球云计算与AI领域的顶级盛会汇聚了海尔、上汽集团、吉利汽车、英伟达等行业龙头企业,聚焦制造、汽车、零售等核心产业,共同探讨生成式AI的产业落地与创新应用。作为重要合作伙伴,销售易携中国首款AI CRM产品NeoAgent亮相,并重点展示了双方基于汽车行业经验联合打造的《汽车行业数字化转型战略与解决方案》。该方案已获捷豹路虎高度认可,通过智能客服实时解析知识库,专业问题响应效率提升70%;基于个性化规则的全流程智能质检推动服务标准化,显著降低客诉风险;AI坐席辅助同步高频故障清单,技术问题转接率下降60%。销售易专家王强分享了"AI+CRM"的创新实践,通过AI技术赋能营销、销售、服务全流程,重构企业增长模式。目前伊顿公司、捷豹路虎、锦江酒店等知名企业已通过销售易NeoAgent实现业务效率倍增和客户体验重构。

  • 周鸿祎:AI无法取代人类 因为学不会这一独特能力

    今天,周鸿祎发布视频谈及对AI的看法。他指出,尽管当下许多人担忧会被AI取代,但目前来看,AI还无法彻底取代人类。 周鸿祎认为,即便智能体再强大,也仍需人类的管理。人类未来的目标是管理、组织和训练智能体。 他以瑞典一家支付巨头为例进行阐述。该公司曾豪言自家AI客服集群能取代700名人类客服,起初成绩亮眼,AI客服处理了大部分客户咨询,效率显著提升。然

  • 从“五位一体”到AI开放平台,盈米基金是如何布局AI生态的?

    盈米基金在2025亚马逊云科技中国峰会上展示AI战略布局,推出"五位一体"数字化投顾体系。副总裁刘永指出,AI可弥补互联网金融服务在深度交互上的短板,实现"广度"与"深度"结合。盈米已构建三大AI应用场景:1)"且慢AI小顾"智能投顾助手,覆盖75%投顾场景,积累超100万有效用户提问;2)"AI编辑部"人机协同系统,每周产出600篇高质量金融内容;3)行业首个财富管理领域MCP开放平台,日均调用超10万次。目前内部AI平台已搭建超1000个工作流,150多个投入生产运行。盈米通过技术开放赋能行业,推动智能投顾生态共建。