首页 > 传媒 > 关键词  > 正文

为AI加速而生 英特尔第五代至强CPU带来AI新表现

2023-12-22 11:05 · 稿源: 站长之家用户

AI时代,亲民、易用的CPU如何能实现相比GPU更具性价比的加速方案?英特尔® 至强® 可扩展处理器给出答案:内置AI加速引擎,更好地承载人工智能应用工作负载。

千呼万唤始出来,第五代英特尔®至强®可扩展处理器,它来了!

若是用一句话来概括它的特点,那就是——AI味道越发得浓厚

以训练、推理大模型为例:

• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;

• 与第三代相比,AI训练和推理性能提升高达 14 倍。

第五代至强处理器

什么概念?

现在若是将不超过 200 亿参数的模型“投喂”给第五代至强®️ 可扩展处理器,那么时延将低到不超过 100 毫秒!

也就是说,现在在CPU上跑大模型,着实是更香了。

而这也仅是英特尔在此次发布中的一隅,还包括打破自家“祖制”、被称为四十年来最重大架构转变的酷睿™️Ultra

此举亦是将AI的power注入到消费级PC中,用于加速本地的AI推理。

除此之外,具体到英特尔长期在各行各业扎根的AI实战应用,包括数据库、科学计算、生成式AI、机器学习、云服务等等,也随着第五代至强®️ 可扩展处理器的到来,在其内置的如英特尔®️ AMX、英特尔®️ SGX/TDX等其他内置加速器的帮助下,得到了更大的降本增效。

总而言之,纵观英特尔此次整场的发布,AI可谓贯穿始终。

##最 新英特尔处理器,AI更Power了

我们先来继续深入了解一下第五代至强®️ 可扩展处理器披露的更多细节。

例如在性能优化方面,英特尔将各种参数做了以下提升:

• CPU核心数量增加到 64 个,单核性能更高,每个内核都具备AI加速功能

• 采用全新I/O技术(CXL、PCIe5),UPI速度提升

• 内存带宽从4800 MT/s提高至5600 MT/s

我们再来纵向,与英特尔前两代产品做个比较,那么性能提升的结果是这样的:

• 与上一代产品相比,相同热设计功耗下平均性能提升21%;与第三代产品比,平均性能提升87%。

• 与上一代产品相比,内存带宽提升高达16%,三级缓存容量提升至近 3 倍之多。

不难看出,第五代至强®️ 可扩展处理器与“前任们”相比,在规格与性能上着实是有了不小的提升。

但英特尔可不仅仅是披露,而是已经将第五代至强®️ 可扩展处理器用起来,并把实打实的使用效果展示了出来。

例如在大模型的推理方面,京东云便在现场展示了搭载第五代至强®️ 可扩展处理器的新一代自研服务器所呈现的能力——

全部以超过20%的性能提升“姿势”亮相!

具体而言,京东云与上一代自研服务器有了如下的性能提升:

• 整机性能提升达123%;

• AI计算机视觉推理性能提升至138%;

• Llama2 推理性能提升至151%。

这也再一次证明了在五代至强®️ 上搞大模型,是越发得吃香了。

而除了大模型之外,像涉及AI的各种细分领域,如整机算力、内存宽带、视频处理等等,也有同样的实测结果。

这份结果则是来自采用了第五代英特尔® 至强® 可扩展处理器的火山引擎——

其全新升级的第三代弹性计算实例,整机算力提升39%;应用性能最 高提升43%。

而且在性能提升的基础上,据火山引擎透露,通过其独有的潮汐资源并池能力,构建了百万核弹性资源池,能够用近似包月的成本提供按量使用体验,上云成本更低了!

这是由于使用内置于第五代至强®️ 可扩展处理器中的加速器时,可将每瓦性能平均提升 10 倍;在能耗低至105W的同时,也有已针对工作负载优化的高能效SKU。

可以说是实打实的降本增效了。

在云计算和安全性方面,亮出实测体验的同样是来自国内的大厂——阿里云

在搭载第五代英特尔® 至强® 可扩展处理器及其内置的英特尔® AMX、英特尔® TDX加速引擎后,阿里云打造了“生成式AI模型及数据保护“的创新实践,使第 8 代ECS实例在安全性和AI性能上都获得了显著提升,且保持实例价格不变,普惠客户。

包括推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%,以及音视频性能提升15%。

值得一提的是,内置的英特尔®️ SGX/TDX还可以为企业分别提供更强也更易用的应用隔离能力和虚拟机 (VM) 层面的隔离和保密性,为现有应用提供了一条更简便的向可信执行环境迁移的路径。

以及第五代英特尔® 至强® 可扩展处理器在软件和引脚上是与上一代兼容的,还可以大大减少测试和验证工作。

总的来说,第五代至强® 可扩展处理器可谓“诚意满满”、表现非常亮眼,而它背后所透露出来的,正是英特尔在AI领域一直都非常重视落地的态度。

##背后是一部AI落地史

事实上,作为服务器/工作端芯片,英特尔® 至强® 可扩展处理器从 2017 年第 一代产品开始就利用英特尔®️ AVX- 512 技术的矢量运算能力对AI进行加速上的尝试;而 2018 年在第二代至强®️ 可扩展处理器中导入深度学习加速技术(DL Boost)更是让至强成为“CPU跑AI”的代名词;在之后第三代到第五代至强®️ 可扩展处理器的演进中,从BF16 的增添再到英特尔®️ AMX的入驻,可以说英特尔一直在充分利用CPU资源的道路上深耕,以求每一代处理器CPU支持各行各业推进AI实战

起先是在传统行业。

例如第二代至强®️ 就发力智能制造,帮助企业解决海量实时数据处理挑战,提升生产线系统效率,完成“肉眼可见”的产能扩展。

随后,至强® 可扩展处理器开始在大模型界大展身手。

AlphaFold2掀起的蛋白质折叠预测热潮之中,第三代和第四代至强® 可扩展处理器连续接力,不断优化端到端通量能力。实现比GPU更具性价比的加速方案,直接拉低AI for Science的入场门槛。

这其中就有从第四代开始内置于CPU中,面向深度学习应用推出的创新AI加速引擎——英特尔® AMX的功劳。作为矩阵相关的加速器,它能显著加速基于CPU平台的深度学习推理和训练,提升AI整体性能,对INT8、BF16 等低精度数据类型都有着良好的支持。

与此同时,在大模型时代的OCR技术应用,也被第四代至强® 可扩展处理器赋予了新的“灵魂”,准确率飙升、响应延迟更低。

同样,就在不久之前,借助第四代至强®️ 可扩展处理器在NLP上的优化,专攻医疗行业的大语言模型也成功以较低成本在医疗机构部署落地。

在AI技术越来越深入各行各业的大趋势之下,至强® 可扩展处理器让我们看到,它所代表的CPU解法完全能够有所作为、能够让不少AI应用在部署更为广泛、获取更加容易、应用门槛也更低的CPU平台上获得实实在在的落地开花。

第五代至强® 可扩展处理器的发布,则让这个进程更进一步。

当然——

这一成绩的背后,确实是因为大家对“在CPU上跑AI”这件事上有需求,以及它本身也有极其深厚的价值和优势。

先说需求,无论是传统企业推进智能化改造,还是AI for Science、生成式AI等新兴技术的蓬勃发展,都需要强大的算力来驱动。

但大家面临的局势却是:专门的加速芯片供不应求,采购难不说,成本也十分高昂,因此还远远不够普及。

于是一部分人自然将目光投向CPU:

这个现实中最为“触手可及”的硬件,如果直接加以利用,岂不是事半功倍?

这就引出CPU的价值和优势。

就拿当下热门话题生成式AI来说,如果想在生产环境中普及这一能力,就得尽可能地控制成本。

相比训练来说,AI的推理对算力资源需求没有那么夸张,交给CPU完全能够胜任——不仅延迟更低,能效也更高。

像一些行业和业务,推理任务没有那么繁重,选择CPU无疑更具性价比。

此外,利用CPU直接进行部署还能让企业充分利用既有IT基础设施,避免异构平台的部署难题。

以上,我们也就能够理解:在传统架构中引入AI加速,就是CPU在这个时代的新宿命

而英特尔做的,就是竭尽全力帮大家挖掘、释放其中的价值。

##驾驭整个AI管线,且不止CPU

最后,我们再回到今天的主角:第五代英特尔® 至强® 可扩展处理器。

实话说,如果和专门的GPU或AI加速芯片相比,它可能确实还不够炫,但主打亲民、易用(开箱即用,配套的软件和生态越发完善)。

更值得我们注意的是,就算在有专用加速器的场合,CPU无论是从数据预处理,还是模型开发和优化,再到部署和使用,也可以成为AI pipeline的一部分。

其中尤其在数据预处理阶段,它已可以称得上是主角的存在。

无论是以GB还是TB计,甚至更大的数据集,基于至强® 可扩展处理器所打造的服务器,都能通过支持更大内存、减少I/O操作等优势,提供高效的处理和分析,节省AI开发中这一最琐碎耗时任务的时间。

基于以上,我们也不得不感叹,如今英特尔在谈AI时,话题更多样化了。

再加上它在GPU和专门的AI加速芯片上也有布局,“武器库”里的选择也更多了,火力覆盖的能力也更全面了。

毫无疑问,这一切,都指向英特尔全面加速AI的决心。

即用一系列具有性价比的产品组合来快速满足不同行业的AI落地需求。

AI 落地时代开始了,英特尔的机会也来了?

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 健康安全认证大考:头部空调表现不佳,海尔例外!

    7月8日,浙江慈溪举办首批"健康安全"认证家电发布会。海尔空调成为行业首个通过该认证的品牌,其新品集除湿、消毒、净化等六种功能于一体,能释放负离子净化空气。该认证由中国家用电器研究院指导,依据多项新国标对产品的抗菌、除菌等功能进行检测。数据显示,海尔洗空气新品在天猫618首发当日登顶空调新品成交榜首。专家表示,健康家电标准体系正逐步完善,消费者可参考权威认证选购产品。

  • TDBC大会揭幕:百度智能云再造数据与AI新连接,激活大模型生命线

    中国通信标准化协会等机构联合主办的"TDBC2025可信数据库发展大会"在京召开。会上公布了上半年"可信数据库"评估测试结果,百度智能云向量数据库VectorDB成为国内首批完成测试的向量数据库产品。该测试覆盖稠密向量检索、多向量检索、标量向量融合检索三种场景,评估指标包括索引构建时间、QPS、延迟、资源占用等多个维度。百度智能云总架构师朱洁指出,超过50%的AI项目时间消耗在数据治理环节,提出构建"智能数据基座"实现数据统一管理,形成"Data+AI+App"闭环。百度智能云通过湖仓一体架构提升AI训练数据效率,智能调度CPU/GPU算力优化资源分配,预计到2028年多数生成式AI应用将直接基于企业数据平台构建。

  • 对话五条人AI MV主创:究竟是人带着AI飞,还是AI带着人类飞

    五条人的美学坐标,锚定在一些具体的意象上,比如县城、故事、人字拖,以及那个标志性的红色塑料袋。他们的音乐与视觉,植根于一种生猛、市井、充满“塑料感”的现实肌理之中。 这样一个极具草根性与现实质感的乐队,与当下最前沿的AIGC技术相遇,结果会是什么? 答案可能就在他们最新专辑同名曲《地球恋曲》的官方MV里。 身着银色宇航服的二人,背着一个巨大的�

  • 聚焦AI新赛道,elexcon深圳国际电子展暨嵌入式展设 AI 机器人专区

    2025年深圳国际电子展暨嵌入式展(ELEXCON)将于8月26-28日举办,聚焦"All for AI, All for GREEN"主题。展会特设AI机器人专区,汇聚越疆、大疆等400+产业链企业,展示从芯片到整机的全产业链技术。同期举办第七届中国嵌入式技术大会,探讨具身机器人嵌入式系统等前沿议题。预计吸引600+机器人领域决策者参与,覆盖AI芯片、汽车电子等热点领域。依托深圳电子产业集群优势�

  • 国内AI新闻平台全面解析:深度盘点主流资讯渠道

    本文梳理了国内主要AI资讯平台的特点和适用人群:36氪侧重创业投资报道,适合关注商业应用;钛媒体提供深度行业分析;雷峰网专注技术解读;机器之心偏重学术研究;AI科技评论具有权威性;AIbase资讯全面及时。建议根据需求选择平台,学术人员可关注机器之心,产业从业者推荐36氪和钛媒体,技术爱好者适合雷峰网,投资者应关注创投媒体频道。未来AI资讯将更专业化、多媒体化,建议建立包含权威平台和新兴渠道的完整信息获取体系,确保资讯的全面性和时效性。

  • 三星Galaxy Z Fold7丨Flip7发布,打造折叠屏AI新范式

    2025年7月9日,三星电子发布新一代折叠屏旗舰Galaxy Z Fold7和Galaxy Z Flip7,以及Galaxy Watch8系列智能手表。Fold7采用纤薄设计,展开厚度仅4.2毫米,搭载定制处理器和2亿像素广角镜头,AI功能支持实时翻译和生成式编辑。Flip7配备超大外屏,重量188克,电池容量为系列最大。Watch8系列采用"天圆地方"设计,集成度提升30%,配备BioActive传感器。新品7月9日开启预约,7月25日正式发售,预约用户可享存储升级等优惠。

  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • 上上签加入日本AILTA,共建可信AI与数字合规新范式

    中国电子签约行业领军服务商上上签电子签约(BestSign)宣布加入日本AI法律技术协会(AILTA),成为该组织正式会员。此举标志着上上签在国际合规生态中的进一步深耕,也意味着其将在AI法律技术和数字签约标准建设中持续发挥"互信合规"的中国方案作用。AILTA是日本LegalTech领域最具代表性的行业协会平台,上上签加入后将与协会在AI合同审查、风险条款识别、数据保护机制等多个方向开展联合研究。上上签CEO万敏表示,加入AILTA是从技术服务走向合规共建的重要一步,未来电子签约比拼的将不仅是功能多少,而是对本地文化、商业伦理、合规诉求的理解深度。

  • AI深度赋能!itc智慧会议室重构协作场景,打造沉浸式会议新范式

    ITC保伦股份将AI技术深度融入音视频会议系统,推出三大智能化升级方案:1)AI+远程视频会议系统实现98%准确率的实时语音转写、跨语言同声传译、4K超分画质和人脸识别签到功能;2)AI+智慧会议平板集成降噪、声源追踪技术,自动生成结构化会议纪要;3)AI+分布式综合管理平台具备50余种智能监测分析能力,支持应急指挥决策。通过AI赋能会议全流程,打造"会前-会中-会后"闭环,推动企业数字化协作升级,引领智慧会议行业变革。

  • 向算而生,自主为羽 | 睿思芯科携灵羽处理器亮相RISC-V中国峰会

    第五届RISC-V中国峰会7月16日在上海张江开幕,睿思芯科展示了中国首款全自研高性能RISC-V服务器处理器"灵羽处理器"。该处理器凭借全栈自主设计、极致扩展与兼容能力、敏捷落地速度三大核心优势引发关注,性能可媲美国际主流架构芯片,标志国产服务器芯片首次突破"高性能、全自研IP、自主SoC"技术壁垒。峰会汇聚全球数百家企业及研究机构,围绕高性能计算、软件与生态系统等热点领域展开讨论。灵羽处理器专为AI大模型等新兴高算力场景设计,已与联想、商汤科技等头部厂商建立深度合作,构建完整生态链,为全球数据中心算力基建提供"中国方案"。