首页 > 传媒 > 关键词  > 英特尔至强6900最新资讯  > 正文

英特尔® 至强® 6:专为 AI 和分析工作负载而构建

2024-11-25 10:17 · 稿源: 站长之家用户

搭载 P-core(性能核)的英特尔® 至强® 6900 系列处理器现已推出。从计算密集型人工智能和高性能计算用例到关键任务关系数据库和分析应用程序,对数据中心性能的需求从未如此之强烈。英特尔® 至强® 6 处理器旨在为 IT 团队提供面向各种工作负载的有针对性的增强功能,它主要借助于两种产品线:P-core(性能核)和 E-core(能效核)。

P-core(性能核)采用超线程内核,内置矩阵引擎可加速计算密集型人工智能、高性能计算和数据服务工作负载,而 E-core(能效核)则省去了矩阵引擎,以支持更高的单线程内核密度。

112521.jpg

所有英特尔® 至强® 6 处理器,无论是 P-core(性能核)还是 E-core(能效核),都采用相同的指令集、BIOS 和内置 I/O 加速器,包括英特尔® 数据保护与压缩加速技术(英特尔® QAT),英特尔® Data Streaming Accelerator(英特尔® DSA),英特尔® In-Memory Analytics Accelerator(英特尔® IAA)和英特尔® Dynamic Load Balancer(英特尔® DLB)。

它们还支持相同的驱动程序、操作系统和应用程序,以及数据中心所依赖的相同可靠性、可用性和可维护性 (RAS) 功能。

探索具有P-core(性能核)优势的英特尔® 至强® 6 处理器

企业希望在部署用于语言、视觉和图像识别以及推荐系统的最先进人工智能模型时节省资金和时间,并从高性能计算驱动的模拟和高级分析中获得更深入的见解。采用 P-core(性能核)的英特尔® 至强® 6 处理器通过提供大量具有创新矩阵和向量引擎以及超高内存和 I/O 带宽的高性能内核,使企业能够抓住这些机遇。

112522.jpg

为广泛的工作负载实现高性能

采用 P-core(性能核)的英特尔® 至强® 6 处理器,每个插槽可灵活扩展至 128 个内核、12 个内存通道和 96 个 PCIe 通道,帮助企业满足不同的应用需求。对于希望缓解内存带宽瓶颈的 IT 团队来说,创新的多路合并阵列 (MRDIMM) 可提供高达每秒 8,800 兆 (MT/s) 的传输速度,同时通过快速完成工作来降低总体拥有成本。内置加速器为目标工作负载提供额外的提升,实现更高的性能和效率。

利用CPU 的强大 AI 性能

采用 P-core(性能核)的英特尔® 至强® 6 处理器旨在支持许多要求严苛的 AI 用例。P-core(性能核)通过英特尔® Advanced Matrix Extensions(英特尔® AMX)等加速功能,扩大了英特尔在内置 AI 领域四代产品的领先优势,目前支持 int8、BF16 和 FP16(新)数据类型。因此,P-core(性能核)可帮助满足从目标检测到中型 GenAI 等多种人工智能模型的服务级别协议 (SLA),同时提供开放标准、高性能、RAS 功能,并根据需要支持其他加速器。

优化通用工作负载的性能

采用 P-core(性能核)的英特尔® 至强® 6 处理器在全范围工作负载上表现出色,其主流系列产品拥有 8-86 个内核,在基于双 CPU 的系统中,网络和存储外接卡拥有多达 176 个 PCIe 5.0 通道,而基于单 CPU 的系统中,单插槽产品则拥有 136 个 PCIe 通道。所有英特尔® 至强® 6 处理器都能随着服务器利用率的增加而提供可扩展的每瓦性能,在整个负载线路上提供近乎线性的功耗-性能消耗,这凸显了所有英特尔® 至强® 6 处理器的高效性。对于性能要求苛刻的工作负载,这意味着平台在高负载下有效地利用能耗,以帮助快速完成工作。

Performance-core(性能核)工作负载性能优势:

与第五代英特尔®至强® 处理器相比:

● 借助英特尔® AMX,Llama2 性能提升高达 3 倍

● HammerDB MySQL 性能提升高达 2 倍

● 利用 MRDIMM,HPCG 基准测试的性能提升高达 2.5 倍

与第二代英特尔®至强® 处理器相比:

● 采用 INT8 的 ResNet – 50 BSX 的性能提升高达 17 倍

与竞争对手相比:

● 与 AMD EPYC 相比,借助 MRDIMM 的 AI 推理性能提升高达 5.5 倍

利用增强的安全功能跟上业务增长的步伐

在本地、边缘和云服务器上追求新的业务模式和数据共享,即使在处理敏感数据或受监管数据时也是如此。基于可信执行环境 (TEE) 的机密计算能够帮助在使用过程中保护数据和 AI 模型。采用 P-core(性能核)的英特尔® 至强® 6 处理器允许客户选择最符合其业务和监管要求的机密计算技术。

应用程序隔离:英特尔® Software Guard Extensions(英特尔® SGX)提供旨在保护使用中数据的应用程序隔离。英特尔® SGX 是目前市场上研究和更新最多的数据中心机密计算技术。

虚拟机(VM) 级隔离:英特尔® Trust Domain Extensions(英特尔® TDX) 在虚拟机级别提供隔离和机密性。在基于英特尔® TDX 的机密虚拟机中,客户机操作系统和虚拟机应用程序被隔离开来,无法被云端主机、虚拟机管理程序和平台的其他虚拟机访问。

增强针对P-core(性能核)优化的目标工作负载

为 AI 、高性能计算和关系数据库等用例管理计算密集型工作负载的 IT 决策者,将从部署采用 P-core(性能核)的英特尔® 至强® 6 处理器中获得最大收益。增加对 MRDIMM 内存的支持,还有助于缓解超大内存占用的内存数据库或大型语言模型 (LLM) 等用例的内存访问限制。

加速AI 工作流程,以保持竞争力

采用 P-core(性能核)的英特尔® 至强® 6 处理器由于配备了增强的内核、更大的内存带宽和强大的矩阵引擎,可提供充足的算力,以支持中小规模生成式人工智能模型的推理、微调和检索增强生成 (RAG) 用例。此外,针对英特尔® 至强® 处理器的优化已集成到 TensorFlow 和 PyTorch 等在内的流行深度学习框架的主流发行版。

管理日益复杂的高性能计算和模拟

除内置矩阵引擎外,采用 P-core(性能核)的英特尔® 至强® 6 处理器还具有英特尔® Advanced Vector Extensions 512(英特尔® AVX-512),可加速科学模拟中常见的基于矢量的数学运算。由该平台提供支持的集群可帮助释放 3D 渲染、科学研究、金融模拟和计算机辅助工程的威力,以加快取得成果。

将基础架构和存储优化提升到新的水平

由于 P-core(性能核)和 E-core(能效核)共享相同的硬件平台,企业可以混合使用具有每种类型内核的系统来管理其基础设施中的各种工作负载,同时不超出功率预算,并遵守数据隐私和主权法规。计算密集型 P-core(性能核)可以支持 SAS 等高强度业务分析软件,而 E-core(能效核)可用于运行系统备份和软件更新等低强度、高空闲时间的工作负载。

提高工作效率,帮助消除边缘的延迟

通过将高性能计算资源置于更靠近终端用户和设备的位置,从而提高边缘生产力和延迟。采用 P-core(性能核)的英特尔® 至强® 6 处理器能够在边缘服务器中部署先进的人工智能模型,并提供所需的算力,以便从数千个物联网设备中快速获得洞察力。具有 136 个 PCIe 通道的单插槽选件还允许每个处理器使用更多的扩展卡,从而有助于在空间有限的部署中整合基础设施。

在保持快速、响应式分析的同时发展关系型数据库

P-core(性能核)处理器中的高级矢量引擎允许有效运行高级数据库和分析用例中常见的基于单指令、多数据 (SIMD) 的工作负载。英特尔® 至强® 6 处理器还能利用高水平的超低延迟缓存,帮助避免与资源争夺有关的延迟。利用该平台和英特尔® QAT 等加速器的多功能配置,可以在分析和存储复杂数据类型时快速得出结果。

1114 要修改替换末尾图片.jpg

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • Panduit 泛达荣获EcoVadis企业可持续发展表现银牌评级

    泛达公司宣布荣获EcoVadis企业可持续发展银牌评级,位列全球前6%,彰显其在环境责任与可持续商业实践方面的坚定承诺。该评估覆盖环境、劳工与人权、商业道德及可持续采购四大核心领域,包含21项可持续发展指标。泛达全球可持续发展经理Mark Dehmlow表示,这一成就证明公司在环境管理、道德采购及员工健康安全方面的努力正产生可衡量影响。作为全球领先的电气与网络基础设施解决方案制造商,泛达将持续提升可持续发展表现,契合市场期望,并支持合作伙伴生态系统及行业优先发展事项。

  • 一加15真机首曝 矩阵Deco 不再联名哈苏

    一加15在PEL夏季总决赛首次亮相,成为新一代官方比赛用机。采用类似一加13T的圆角矩阵摄像头设计,搭载OPPO LUMO影像系统,首发1.5K+165Hz超高分屏。配备骁龙8至尊版芯片,采用台积电3nm工艺,CPU为2+6全大核架构,超大核主频4.61GHz,GPU主频1.2GHz。

  • ColorOS 16将于10月15日发布 Find X9系列全球首发搭载

    OPPO将于10月15日举办ColorOS 16发布会暨开发者大会。新系统底层升级至安卓16,重点优化动画渲染与资源分配,实现丝滑流畅体验。新增潮汐引擎与极光引擎,提升系统稳定性和流畅度。目前尝鲜活动已开启,覆盖一加13、Find X8系列等多款机型。10月发布的Find X9系列将首发搭载ColorOS 16,成为全球首款该系统的旗舰机型。

  • 海辰储能AIDC储能解决方案亮相RE+ 2025,以长时储能赋能AI数据中心绿色转型

    海辰储能在RE+2025展会上发布面向AI数据中心的储能解决方案,包括6.25MWh锂电长时储能系统和2.28MWh钠电储能系统。该方案创新融合锂电稳定性和钠电高倍率优势,可满足数据中心对电力实时性和稳定性的严苛需求,助力提升绿电使用占比,标志着长时储能在数据中心应用的全新突破。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 拥抱AI变革,点燃算网引擎:2025开放数据中心大会在京召开

    2025年9月9日至11日,以“拥抱AI变革,点燃算网引擎”为主题的2025开放数据中心大会在北京成功举办。大会聚焦算力技术发展,发布63项研究成果,涵盖服务器、数据中心设施、网络、边缘计算、智能运营等领域。多位行业专家分享前沿趋势,强调加强算力标准布局与产业协同,推动开放融合的算力生态建设。同期举办近20场分论坛及人才培训活动,旨在汇聚产业智慧,赋能行业提质增效,加速数字经济发展。

  • 碾压级GPU性能,3倍光追提升,天玑9500打造手机游戏最强心脏

    2025年9月22日,联发科发布天玑9500旗舰5G芯片,其GPU性能与能效双领先,被媒体称为“最强GPU”。天玑9500搭载G1-Ultra核心,采用全新GPU+Dynamic Cache架构,在3DMark测试中峰值达3402分,功耗仅12.3W,全程超越A19Pro。光追性能提升3倍,支持主机级虚幻引擎5.5 Nanite技术,实现千万级模型渲染,并首发Megalights技术,流畅运行《暗区突围》光追120FPS。实测显示其图形表现达到移动处理器顶尖水平,重构移动端图形性能天花板。

  • 曝MacBook塞进iPhone处理器:售价亲民

    分析师郭明錤透露,苹果MacBook系列新品规划:2026年底量产OLED版MacBook Pro,配备触控面板;2025年Q4推低价版MacBook,搭载iPhone同款A18 Pro处理器,目标年轻用户,配13英寸屏和多彩外壳,支持AI任务。苹果希望通过低价产品扩大市场份额。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

今日大家都在搜的词: