首页 > 传媒 > 关键词  > 英特尔最新资讯  > 正文

英特尔® 矩阵扩展加速AI工作负载

2024-11-13 14:04 · 稿源: 站长之家用户

英特尔推出的第四代和第五代英特尔® 至强® 可扩展处理器及其内置的英特尔® 高 级矩阵扩展(Intel® Advanced Matrix Extensions,英特尔® AMX)可进一步提高 AI 功能。与第三代英特尔® 至强® 可扩展处理器相比,第五代英特尔® 至强® 可扩展处理器可使推理工作负载的性能提升高达 10 倍,每瓦性能提升高达 7 倍。

优化AI管线

从图书和电影推荐系统到驱动大型电商网站的数字化零售软件,再到支持聊天机器人和机器翻译的自然语言处理 (NLP) 功能,企业可通过在不同场景中应用 AI 获得诸多收益。 AI 真正的价值在于其能够解析复杂环境和海量数据的特性,以及解决以往难解之题的能力,而这正是不断推进企业革新的关键潜能。据研究显示,到 2025 年,90% 新发布的企业应用版本都将包含嵌入式 AI 功能。

第四代和第五代英特尔® 至强® 可扩展处理器内置 AI 加速器——英特尔® AMX,是企业和机构优化 AI 管线的理想选择。平衡推理是 CPU 在 AI 应用中的主要用例,而这款英特尔® AI 引擎专为该用例设计并且具备更多训练能力(见图 )。目前,在所有运行 AI 推理工作负载的已装机数据中心处理单元中,英特尔® 至强® 可扩展处理器的占比高达 65%; 因此,为新的 AI 部署选择内置英特尔® AMX 的第四代和第五代英特尔® 至强® 可扩展处理器,是一种既高效又具有成本效益的 AI 工作负载加速方式。

选择内置加速器的理由

目前,采用内置英特尔® 深度学习加速技术(Intel® Deep Learning Boost,英特尔® DL Boost)的第三代英特尔® 至强® 可扩展处理器支持 AI 部署,可满足 IT 部门履行客户服务级别协议 (SLA) 的要求,而内置英特尔® AMX 的第四代和第五代英特尔® 至强® 可扩展处理器则将带来新的变革。

如图所示:与上一代产品相比,内置英特尔® AMX 的第五代英特尔® 至强® 可扩展处理器,可将实时推理性能提升高达 1.23 至 1.35 倍,可将实时推理每瓦性能提升高达 1.2 至 1.38 倍5,6,7。

第五代英特尔® 至强® 可扩展处理器与第三代英特尔® 至强® 可扩展处理器相比能够带来的总体拥有成本 (TCO) 优势。针对批量 NLP 推理 (BERT-Large) 工作负载,只需 13 台基于第五代英特尔® 至强® 可扩展处理器的服务器即可实现 50 台基于第三代英特尔® 至强® 可扩展处理器的服务器所能提供的性能8。服务器数量的减少意味着更低的能耗和更低 CO2 排放量,从而实现多达 64% 的 TCO 节约8。

英特尔® AMX 带来的性能提升远大于每一代产品(从第 一代英特尔® 至强® 可扩展处理器开始)通过增加内核所实现的性能提升。

欲了解更多行业应用详情,请访问硬蛋聚合商官网 www.ingdan.com

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 雷军预热小米手表S4 41mm:表冠镶嵌钻石 质感非常高级

    小米将于今晚19:00举办新品发布会,届时将发布新车YU7、小米MIX Flip 2、REDMI K80至尊版、小米手表S4 41mm等十余款新品。 发布会前夕,小米CEO雷军微博发文为小米手表S4 41mm预热。 雷军表示,小米手表S4 41mm是小米首款小尺寸的智能腕表,质感非常高级,采用经典腕表的简约设计。

  • 双模型矩阵驱动教育AI专业化,猿辅导小猿AI以技术重塑教育本质

    猿辅导集团将于2025年4月推出革命性教育AI产品"小猿AI",通过"技术+教育"双核驱动,重新定义个性化学习。该产品基于自研"猿力大模型"和DeepSeek-R1推理大模型,整合15亿题库、3亿分钟教学视频等教育资源,实现知识点拆解、错因分析和学习路径优化。小猿AI具备作业批改、学习闭环管理、情感化设计等功能,支持100多种题型识别,准确率达99%。产品采用"软件+硬件+课程"三位一体模式,覆盖299个教材版本,构建分层阅读体系。通过AI赋能,让每个孩子找到专属成长路径,推动教育回归启迪智慧的本质。

  • 九章云极智能科技论坛全览:为AI加速

    九章云极DataCanvas公司在北京召开智能计算论坛,发布新一代全栈智能计算云平台Alaya NeW Cloud2.0,创新融合Serverless与强化学习技术,突破百万级token生成性能瓶颈。该平台支持万卡级异构算力统一调度,显著降低AI开发门槛,推出"一度算力"按需计费模式。同时成立1.8亿元"AI-STAR生态基金",联合产业伙伴共建开放生态。Forrester预测2025年全球企业将积极采用AI原生智算云平台,认为其能实现AI应用全生命周期性能最大化。九章云极还发布强化学习云平台AgentiCTRL,将AI训练门槛压缩至单行代码,训练效率提升5倍。公司表示未来3-5年将通过技术创新突破算力成本瓶颈,实现普惠化应用。

  • 支付宝出手了,全民级的AI健康管家来了。

    ​这两天我快被AI医疗包围了。 昨天那篇达摩院的AI医疗文章又一点小火,然后,就受邀来参加蚂蚁的AI医疗产品发布会了。 人在现场,看着全新的AI产品发布,AQ。 跟达摩院是完全两个方向,但是,都很有意思。 这个AQ,更ToC,更加的医疗普惠,万万没想到,先把AI健康助手,做出来的,是蚂蚁。 我不知道大家,我自己身体其实经常不是很好,但是我人在北京,北京的医�

  • AI语音迎来「特斯拉时刻」,一条工作流「吃掉」全球百亿市场

    OpenAI推出新一代语音模型GPT-4o系列,包括语音转文本和文本转语音功能,开发者可通过API接入。趣丸科技推出的"趣丸千音"平台依托MaskGCT模型,在语音相似度、质量和稳定性上取得突破,实现视频翻译全流程自动化,日处理量超1000分钟,效率提升10倍。该技术已应用于短剧出海、新闻视频多语言分发等场景,使译制周期从30天缩短至3天,海外用户增长300%。AI语音技术正�

  • 索尼发布相机遥控工具包新版本,支持更多场景扩展开发

    索尼中国于2025年6月23日发布相机遥控软件开发包2.00版本,新增支持BRC-AM7、ILME-FR7(Ver3.00及以上)、ILME-FX3A和ILME-FX2等机型。主要更新包括:1)新增删除相机存储数据功能,优化工作流程;2)支持PTZ摄像机系列产品控制。同步更新的相机遥控命令协议2.00版本新增对ILCE-1M2等更多机型的支持,功能与SDK保持一致。开发者可通过索尼SDK官网获取更新详情,根据需求选择合适的开发工�

  • 阿里云”618创新加速季“开启:先进、领先的大模型限免 超7000万 token,加速多场景 AI 应用落地

    阿里云启动"618创新加速季"活动,聚焦AI创新与云端智能,推出多项优惠:1)提供7000万+免费大模型token体验及最高1728元优惠券;2)通义大模型限免超7000万token,推出10-100元多档资源包,GPU服务0.9折起;3)PAI平台推出通用节省计划,最低3折;4)针对中小企业推出AI火花会主题活动,提供场景化定制服务;5)基础云产品全线优惠,包括轻量服务器38元/年、RDS MySQL 88元/年等。活动还包含5亿算力补贴计划、10万元出海满减券等专项支持,助力企业智能化升级。

  • 精致护衣 优雅出行 三星AI神 黑钻衣物护理机让工作生活张弛有度

    三星AI神+黑钻衣物护理机集智能护理、便捷操作与时尚设计于一体,采用双气流+双蒸汽创新技术,无需水洗即可快速去除衣物浮尘异味,抚平褶皱。AI智能控制面板可记录用户习惯,一键启动专属护理程序,同时处理9件衣物。内置香氛盒实现去味增香,镜面设计方便整理穿搭,还能化身除湿机改善居家环境。该产品重新定义了高端衣物护理体验,让精致穿搭与健康生活完美融合,成为现代家庭提升生活品质的智能伴侣。(140字)

  • 高通AR2芯片赋能AR眼镜革新,三星/微美全息加速竞跑AR技术与生态圈

    增强现实(AR)技术迎来重大突破,高通AR2+芯片通过多芯片架构实现端侧算力提升3倍,同时实现轻量化设计。谷歌推出首款安卓系统AR眼镜,Meta、苹果、三星等科技巨头也纷纷布局智能眼镜领域。数据显示,2025年一季度全球AI智能眼镜销量达60万台,同比增长216%。行业普遍认为AR眼镜正从极客玩具迈向大众智能终端,有望成为继智能手机后的下一代主流计算平台。微美全息等企业加速布局AR技术与生态,推动产业链上下游协同发展。随着AI及显示技术成熟、应用场景多元化,AR眼镜行业正迎来破局阶段。