首页 > 业界 > 关键词  > 数据中心,四代至强,至强Max系列,PonteVecchio最新资讯  > 正文

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

2023-03-31 22:29 · 稿源: 快科技

尽管在日常生活中,大多数普通用户都接触不到服务器和数据中心平台,但是一方面,我们使用的很多软件和互联网服务,背后就是数据中心在默默提供支撑,另一方面,大量先进的计算技术都首先应用于数据中心,并惠及消费级平台。

所以,数据中心看似遥远,其实就在我们身边。

今年1月11日,英特尔正式发布了代号Sapphire Rapids的第四代至强可扩展处理器(下文简称四代至强),还有集成HBM高带宽内存的至强Max系列,以及代号Ponte Vecchio的数据中心GPU Max系列。

虽然乍一看,四代至强的有些规格不如竞品,但事实上,英特尔现在追求的,已经不再是单一产品参数,而是打造更强大、更灵活、更适应未来的综合算力平台。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰指出,虽然传统上都认为Intel是一家CPU处理器公司,但在多元化的数字和数据时代,Intel提出了全新的XPU”战略,通过提供CPU、GPU、FPGA、IPU等多种异构产品,为不同业务、应用场景提供定制化的算力解决方案。

除了硬件,Intel的软实力也不容小觑,旗下有着规模庞大的软件团队和研究院,毕竟,强大的软件是充分释放硬件潜力的关键。

尤其是在开源方面,英特尔一向毫不吝啬,为开源生态和社区贡献了大量的软件架构,这也有利于推动英特尔产品的应用和生态的扩展。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

四代至强不仅拥有Intel 7先进工艺、全新架构,以及业界领先的DDR5、PCIe 5.0、CXL 1.1,更是在加速器方面引领了新潮流。

四代至强发布的时候,Intel强调它具备七大神器”,包括高级矩阵扩展(AMX)、动态负载均衡器(DLB)、数据流加速器(DSA)、存内分析加速器(IAA)、数据保护与压缩加速技术(QAT)、安全引擎(Security)、至强Max高带宽内存(HBM)。

这些加速器不会改变已有的算法,仍是对算法的计算进行加速,从而提高效率、节约时间,也让客户进一步可以去设计新的算法。

根据官方数据,四代至强通过内置的丰富加速器,相比上代产品将目标工作负载的平均能效(每瓦性能)提升了多达2.9倍,而在优化电源模式下,每颗处理器可以节能高达70瓦且性能的影响极低,总体拥有成本也降低52-66%。

具体应用实例方面,比如腾讯借助AMX提升搜索、视频业务效率;比如京东利用IAA、DSA将天枢服务器性能提升超过1.7倍;比如阿里云第八代ESC实例整体算力提升60%、数据库读写性能提升15%、加解密和压缩解压性能提升4倍、AI推理性能提升4倍;比如火山引擎第三代弹性计算实例整机算力、单核算力、网络转发、存储IOPS、加解密、AI推理加速等全面明显提升

英特尔技术专家也分享了四代至强加速器在多个具体应用场景中的体现:

- 阿里的地址标准化”服务(如淘宝收货地址定位),使用AMX INT8加速和软件优化,单位时间查询性能提升2.48倍。

- 淘宝APP首页定制化推荐服务,使用AMX BF16、软件优化、AVX-512调优,性能提升3倍。

- 部署于腾讯云上的太极机器学习平台支撑的搜索和广告业务,使用AMX BF16/INT8,高精度实例性能提升3倍,低精度实例性能提升2倍,云服务实例所需CPU数量也大大减少。

- Stable Diffusion注意力机制,使用AMX BF16加速矩阵计算,使用AVX-512加速指数计算,搭配PyTorch插件,吞吐性能提升3.82倍。

- 亚信电信营业厅OCR方案,使用AMX软硬件优化,性能提升3.94倍。

- 用友企业ERP OCR服务使用AMX BF16/INT8加速,性能提升2.83倍。

- Clickhouse大数据分析数据库,使用IAA,Q4.1压缩解压性能提升40%。

- MongoDB数据库,使用IAA,性能提升47%。

- DML、DPDK、SPDK等软件库,均已集成DSA,性能可提升2.25倍,CPU资源可节省66%。

- 微软SQL Server,使用QAT加速,备份时间可缩短2/3,性能可提升1.34倍。

- Gbase 8a并行数据库,使用IAA,ZSTD压缩算法性能提升1.84倍,RapidZ压缩算法性能提升1.66倍。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

四代至强发布之后,英特尔又加推了vRAN Boost,完全集成物理层加速功能,不再需要独立的加速卡,成为四代至强的新神器”。

使用这一加速器,运营商可以在通用虚拟化平台上整合所有基站层,从而以通用处理器实现基站功能。

与上一代相比,vRAN Boost加速器能够在不增加功耗的情况下,提供两倍的容量,同时节省多达20%的能耗,满足关键的性能、扩展和能效要求。

英特尔技术专家指出,CPU处理器的发展趋势曾经就是单纯地提高频率、增加核心数量,但是对于互联网客户来说,特殊需求越来越多,比如压缩解压、加解密等等,更多核心、更高频率不一定能带来足够高的效率提升,提供一个专用加速器反而会有奇效,它相比异构计算距离内存也更近。

同时,随着客户和行业越来越重视能效,加速器也是提升能效比的有效途径。

当然,集成加速器会增加处理器的设计难度,影响验证上市时间,也会增加生态适配的难度,而这就体现了英特尔强大的业界影响力和号召力,可以推动生态支持,保证产品上市的时候就有大量软件服务可以支持到位。

值得一提的是,并不是每家客户都需要那么多的加速器,因此英特尔还提供了全新的On Demand服务,客户可以根据自己的实际需要,灵活选购不同的加速器,也可以按照使用量来开关付费。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

庄秉翰还指出,随着双碳”、新基建、东数西算”的推进,对未来数据中心能耗的需求越来越严苛,绿色计算成为可持续发展的关键动力。

四代至强集成的众多加速器,能够以更高效率、更低能耗处理这种需求越来越大、越来越复杂的工作负载,换言之就是用更少能源消耗的完成更多的工作,同时还有一系列新的电源管理方案辅佐,进一步提高能效

在制造过程中,Intel使用的电力已经超过90%都是可再生能源,并且三代、四代至强提供一年的浸没式液冷方案保修服务,这在业界还是唯一一家。

如此种种,都让四代至强成为最具可持续性的数据中心处理器。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

英特尔至强可扩展处理器诞生于2017年,迄今已经累计交付超过8500万颗,其中第三代产品在过去两年就出货了1500万颗。

最新的第四代产品已经完成了400多款不同设计方案,200多款已出货,前十大云服务提供商都会在今年部署基于新至强的云实例。

面向未来,随着算力市场需求的提高、应用的拓展,英特尔也在有针对性地开发新产品,都在顺利推进中。

比如2023年内推出下一代Emerald Rapids,2024年开始更是迎来全新变革,基于性能核的Granite Rapids、基于能效核的Sierra Forest,都会升级到Intel 3制造工艺,并集成更多核心,对于微服务、容器化场景非常适合。

总的来说,英特尔至强可扩展平台已经跳出来单纯拼参数的传统巢窠,进入了全新的加速器时代,通过针对特定负载和应用需求进行加速,以更灵活的方式、更低的能效实现更高的效率,更适应多元化的新算力时代。

如此,新至强既为客户实现更高的经济效益,又符合节能减排、绿色可持续发展的全球趋势,也让我们对至强可扩展平台未来的发展,有了更高的期待。

举报

  • 相关推荐
  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • vivo WATCH GT 2已支持开通移动/联通eSIM服务

    vivo WATCH GT2智能手表正式支持中国移动与联通的eSIM服务,提供一号双终端和独立终端两种模式,售价699元。配备2.07英寸大屏、2400nits峰值亮度,续航达33天。支持全天心率、血氧、睡眠监测及多种运动模式,搭载自研蓝河操作系统3.0与智能助手,可跨设备连接vivo和iPhone,实现双机通知同步。

  • iPhone 18系列或将首发自研基带C2

    苹果计划在明年推出自研基带C2,采用台积电4nm工艺,由iPhone 18系列首发,取代高通方案,实现更自主的通信技术。今年iPhone 16已首发C1基带,支持5G,赢得市场关注。C2将支持5G毫米波技术,提升网络体验。随着苹果自研基带逐步上线,高通在苹果调制解调器市场份额预计到2026年降至20%,对其市场地位产生重大影响。此外,iPhone 18还将首发台积电2nm工艺的A20芯片,标志iPhone进入2nm时代,带来更优性能与能效。

  • 双十一钜惠来袭,让AOC小Q MAX阅读器8R1成为最温暖的冬日礼物!

    AOC小Q+MAX阅读器8R1双十一钜惠来袭!8.2英寸E-ink墨水瓶如纸质书般舒适,292PPI高清显示搭配冷暖双光调节,四核处理器保障流畅运行。限时享国家补贴15%,到手价低至1529元,PLUS会员可叠加优惠券,前100名晒单再得50元E卡。这款阅读器以纤薄机身、长效续航和AI朗读功能,成为秋冬阅读的理想伴侣,助你开启深度阅读新篇章。

  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 24天超长续航!REDMI Watch 6官宣:与K90系列同台发布

    Redmi Watch 6于10月23日与K90系列同台发布。外观延续方形表盘,边框从圆润改为直角倒角,视觉更轻薄;表冠上移,新增独立按键,布局类似Apple Watch。配备2.07英寸AMOLED大屏,支持彩色AOD显示,采用高强铝中框,内置小米澎湃OS 3,续航长达24天。预计搭载玄戒T1芯片,集成CPU、GPU及小米自研4G基带,支持4G eSIM独立通信,性能提升35%,功耗显著降低。

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

今日大家都在搜的词: