首页 > 传媒 > 关键词  > IBM最新资讯  > 正文

IBM重磅推出全新Telum处理器,依托新一代IBM Z大型主机加速AI应用

2024-09-02 11:51 · 稿源: 站长之家用户

新闻要点:

· 新一代IBM Telum II 处理器和 IBM Spyre 加速器可解锁更多企业级 AI 能力,包括大语言模型和生成式 AI

· 先进的 I/O 技术实现并简化可扩展的 I/O 子系统,进一步降低能耗和数据中心占地面积

北京2024年8月30日 -- 近日,IBM(纽约证券交易所:IBM) 在 Hot Chips2024大会上公布了即将推出的 IBM Telum II 处理器和 IBM Spyre 加速器的架构细节。这些新技术旨在大幅扩展下一代 IBM Z 大型主机系统的处理能力,通过新的 AI 集成方法,加速企业对传统 AI 模型和大语言 AI 模型的协同使用。

随着基于大语言模型的 AI 项目从概念验证阶段进入生产阶段,企业对高能效、高安全性和高度可扩展解决方案的需求日益迫切。摩根士丹利最近发布的一份研究报告预测,在未来几年,生成式 AI 的电力需求将以每年75% 的速度激增,其2026年的能耗或将与西班牙2022年的全年能耗相当。许多 IBM 客户表示,支持适当规模的基础模型和针对 AI 工作负载的混合架构越来越重要。

此次IBM发布的主要创新技术包括:

· IBM Telum II 处理器: 这一全新芯片将搭载于下一代 IBM Z 系列主机,与第 一代 Telum 芯片相比,其频率和内存容量均有提升,高速缓存提升40%;集成 AI 加速器内核和数据处理单元 (DPU) 的性能也得到改善。IBM Telum II处理器将支持大语言模型驱动的企业计算解决方案,满足金融等行业的复杂交易需求。

· IO 加速单元: Telum II 处理器芯片上的全新数据处理单元 (DPU) 旨在加速大型主机上用于联网和数据存储的复杂 IO 协议,可简化系统操作,提高关键组件性能。

· IBM Spyre加速器: 可提供额外的AI计算能力,与 Telum II 处理器相得益彰。Telum II 和 Spyre 芯片共同构成了一个可扩展的架构,可支持AI集成建模方法,即将多个机器学习或深度学习的AI模型与基于编码器的大语言模型相结合。通过利用每个模型架构的优势,AI集成的方法可以生成比单个模型更准确、更稳健的结果。Spyre 加速器芯片在 Hot Chips2024大会期间进行了预览,并将作为Telum II 处理器的附加选件提供。每个加速器芯片均与IBM 研究院合作开发,通过一个75瓦 PCIe 适配器连接。与其他 PCIe 卡一样,Spyre 加速器可根据客户需求进行扩展。

IBM主机和LinuxONE 产品管理副总裁 Tina Tarquinio 表示:“得益于IBM强大的多代并行的开发路线图,我们得以在保持技术领先的同时,满足企业不断升级的 AI 需求。Telum II 处理器和 Spyre 加速器旨在提供安全、节能、高性能的企业计算解决方案。这些多年研发的创新成果将被引入下一代 IBM Z 平台,帮助客户大规模利用大语言模型和生成式 AI技术。”

Telum II 处理器和 IBM Spyre 加速器将由 IBM的长期合作伙伴三星晶圆代工(Samsung Foundry)生产,采用其高性能、高能效的5纳米工艺节点。二者将共同支持企业的先进AI 用例,释放业务价值,从而创造新的竞争优势。利用AI集成的方法,客户可以更快、更准确地获得预测结果。适用的生成式 AI用例包括:

· 保险理赔欺诈检测: 通过AI集成方法将大语言模型与传统神经网络相结合,以提高性能和准确性,增强对保险理赔欺诈的检测。

· 反洗钱高 级监测: 对可疑金融活动进行高 级检测,支持遵守监管要求并降低金融犯罪风险。

· AI 助手: 加速应用生命周期、知识和专业技能的传授、代码解释和转换等。

规格和性能指标:

· Telum II 处理器: 配备八个运行频率达 5.5GHz的高性能内核,每个内核配备36MB二级高速缓存,片上高速缓存容量增加40%(总容量达 360MB)。每个处理器抽屉的虚拟 L4高速缓存为2.88GB,相比上一代增加40%。集成的 AI 加速器可实现低延迟、高吞吐量的交易中AI 推理,例如增强金融交易期间的欺诈检测,并且每块芯片的计算能力是上一代的四倍。

Telum II 芯片中集成了最 新的 I/O 加速单元 DPU。在设计上,其I/O 密度提高50%,可大幅提高数据处理能力,进一步提高 IBM Z 的整体效率和可扩展性,使其成为处理大规模AI工作负载和数据密集型应用的不二之选。

· Spyre 加速器: 这是一款专为复杂AI模型和生成式AI用例提供可扩展功能的企业级加速器。它有高达1TB 的内存,可在普通 IO 抽屉的八块卡上串联工作,以支持大型主机的整体AI 工作负载,同时每块卡的功耗不超过75W。每块芯片由32个计算内核组成,支持 int4、int8、fp8和 fp16数据类型,适用于低延迟和高吞吐量的 AI 应用。

产品时间表

作为 IBM 下一代 IBM Z 和 IBM LinuxONE 平台的中央处理器,Telum II 处理器预计在 2025年向 IBM Z 和 LinuxONE 客户提供。IBM Spyre 加速器仍在技术预览阶段,预计也将于2025年推出。

关于 IBM 未来方向和意向的声明可能会随时更改或撤销,恕不另行通知。

关于IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过175个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过4000家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、有效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Kvistly:AI驱动的互动式测验制作工具

    Kvistly是一个利用人工智能技术创建互动式测验的平台,旨在提升销售培训、团队建设、培训和入职等环节的效率和参与度。它通过实时的互动学习连接真人,增强团队协作和知识传递。产品背景信息显示,Kvistly在教育和商业培训领域具有重要性,通过游戏化学习提高员工的参与度和学习效果。价格方面,Kvistly提供定价信息,但具体细节需访问其定价页面了解。

  • Quetzal:现代国际化平台,快速实现产品多语言支持。

    Quetzal是一个现代国际化平台,旨在帮助用户快速将产品翻译成多种语言,以获得全球新客户。该平台提供工具,支持20多种语言,与Next.js和React兼容,并且拥有快速设置流程,仅需约10分钟。Quetzal利用人工智能技术,结合应用程序的上下文,在几分钟内实现最佳翻译效果。它还提供了一个仪表板,让用户可以在一个地方查看和管理所有的字符串。产品背景信息显示,Quetzal由Quetzal Labs, Inc.在奥克兰精心打造,并且提供了一个慷慨的免费计划,直到用户添加第二种语言。

  • Aria:多模态原生混合专家模型

    Aria是一个多模态原生混合专家模型,具有强大的多模态、语言和编码任务性能。它在视频和文档理解方面表现出色,支持长达64K的多模态输入,能够在10秒内描述一个256帧的视频。Aria模型的参数量为25.3B,能够在单个A100(80GB)GPU上使用bfloat16精度进行加载。Aria的开发背景是满足对多模态数据理解的需求,特别是在视频和文档处理方面。它是一个开源模型,旨在推动多模态人工智能的发展。

  • Marqo:训练和部署嵌入式模型的AI平台

    Marqo是一个专注于训练和部署嵌入式模型的平台,它提供了一个端到端的解决方案,从模型训练到推理,再到存储。Marqo支持150多种嵌入式模型,并且可以快速原型设计,加速迭代,并无缝部署。该平台支持多模态模型,如CLIP,可以从图像和其他数据类型中提取语义信息,实现文本和图像的无缝搜索,甚至可以将文本和图像组合成一个向量。Marqo还支持100多种语言的搜索,提供最先进的多语言模型,无需手动进行语言配置即可扩展到新的地区。此外,Marqo的可扩展性允许用户在笔记本电脑上的Docker镜像中运行,也可以扩展到云端数十个GPU推理节点,提供低延迟的搜索服务。

  • AMD Instinct MI325X Accelerators:为AI基础设施提供领导性的AI性能

    AMD Instinct MI325X加速器基于AMD CDNA 3架构,专为AI任务设计,包括基础模型训练、微调和推理,提供卓越的性能和效率。这些产品使AMD的客户和合作伙伴能够在系统、机架和数据中心层面创建高性能和优化的AI解决方案。AMD Instinct MI325X加速器提供了行业领先的内存容量和带宽,支持6.0TB/s的256GB HBM3E,比H200多1.8倍的容量和1.3倍的带宽,提供了更高的FP16和FP8计算性能。

  • Ryzen™ AI PRO 300 Series Processors:第三代商用AI移动处理器,为商务用户带来前所未有的AI计算能力和多日电池续航。

    AMD Ryzen™ AI PRO 300系列处理器是专为企业用户设计的第三代商用AI移动处理器。它们通过集成的NPU提供高达50+ TOPS的AI处理能力,是市场上同类产品中性能最强的。这些处理器不仅能够处理日常的工作任务,还特别为满足商务环境中对AI计算能力的需求而设计,如实时字幕、语言翻译和高级AI图像生成等。它们基于4nm工艺制造,并采用创新的电源管理技术,能够提供理想的电池续航能力,非常适合需要在移动状态下保持高性能和生产力的商务人士。

  • Unify Plays:快速构建端到端的营销活动

    Unify Plays是一个商业营销平台,它通过集成AI、自动化和数据验证技术,帮助企业构建和运行能够生成潜在客户并促进销售的营销活动。这个平台的主要优点在于其一体化的解决方案,能够减少企业在营销活动中对多个工具的依赖,提高效率,同时通过AI技术实现个性化营销,提升客户参与度和转化率。Unify Plays的背景信息显示,它是由Unify公司开发,旨在为高增长企业提供一种更高效、更智能的营销方式。关于价格,Unify Plays提供了不同的套餐选项,以满足不同规模企业的需求。

  • Eddie AI:您的AI故事讲述伙伴

    Eddie AI是一个创新的视频编辑平台,它利用人工智能技术帮助用户快速、轻松地编辑视频。这个平台的主要优点是它的用户友好性和高效率,它允许用户像与另一个编辑交谈一样与AI对话,提出他们想要的视频剪辑类型。Eddie AI的背景信息显示,它旨在通过使用自定义的AI编辑/故事模型来扩展视频编辑的规模,这表明它在视频制作领域具有潜在的革命性影响。

  • Cooraft:将自拍变成艺术工作室视频和照片,卡通动画和艺术渲染,只需一键。

    Cooraft是一款利用人工智能技术将普通照片转化为艺术作品的应用程序。它能够将自拍和日常照片转化为具有创意和艺术性的动画和渲染图,提供从3D卡通到经典绘画等多种艺术风格。Cooraft不仅能够美化人像,还能将素描、绘画、线稿等多种输入转化为新的渲染图,实现从2D到3D的转变。此外,Cooraft还提供了订阅服务,用户可以通过订阅获得更多高级功能。

  • DreamMesh4D:从单目视频生成高质量4D对象的新型框架

    DreamMesh4D是一个结合了网格表示与稀疏控制变形技术的新型框架,能够从单目视频中生成高质量的4D对象。该技术通过结合隐式神经辐射场(NeRF)或显式的高斯绘制作为底层表示,解决了传统方法在空间-时间一致性和表面纹理质量方面的挑战。DreamMesh4D利用现代3D动画流程的灵感,将高斯绘制绑定到三角网格表面,实现了纹理和网格顶点的可微优化。该框架开始于由单图像3D生成方法提供的粗糙网格,通过均匀采样稀疏点来构建变形图,以提高计算效率并提供额外的约束。通过两阶段学习,结合参考视图光度损失、得分蒸馏损失以及其他正则化损失,实现了静态表面高斯和网格顶点以及动态变形网络的学习。DreamMesh4D在渲染质量和空间-时间一致性方面优于以往的视频到4D生成方法,并且其基于网格的表示与现代几何流程兼容,展示了其在3D游戏和电影行业的潜力。

  • Kaption AI:使用AI技术将WhatsApp音频消息转文字并生成摘要

    Kaption AI是一款Chrome浏览器插件,它利用人工智能技术将WhatsApp上的音频消息转换成文字,并提供消息摘要和回复建议。这款插件重视用户隐私和安全性,采用先进的AI技术实现准确的转录和总结。它特别适合那些经常使用WhatsApp且难以听取长音频消息的用户,帮助他们节省时间,只关注重要的信息。

  • CursorCore:开源AI辅助编程模型系列

    CursorCore是一系列开源模型,旨在通过编程指令对齐来协助编程,支持自动化编辑和内联聊天等功能。这些功能模仿了如Cursor这样的闭源AI辅助编程工具的核心能力。该项目通过开源社区的力量,推动了AI在编程领域的应用,使得开发者能够更加高效地编写和编辑代码。目前该项目处于早期阶段,但已经展示了其在提高编程效率和辅助代码生成方面的潜力。

  • WiseWorld:AI驱动的虚拟世界,用于软技能评估和培训

    WiseWorld是一个利用人工智能和游戏化技术来提升员工软技能的平台。它通过模拟真实生活情景,帮助员工在沟通、问题解决、团队合作等方面进行实践和提升。WiseWorld通过角色扮演和模拟练习,为团队领导者和成员提供了一个安全的环境来尝试不同的策略并获取即时反馈。此外,它还提供了一个管理者仪表板,使领导者能够实时了解团队动态、个人表现和整体进展,从而做出数据驱动的决策,提高领导效能和团队凝聚力。

  • Pyramid Flow:高效视频生成建模的金字塔流匹配技术

    Pyramid Flow 是一种高效的视频生成建模技术,它基于流匹配方法,通过自回归视频生成模型来实现。该技术主要优点是训练效率高,能够在开源数据集上以较低的GPU小时数进行训练,生成高质量的视频内容。Pyramid Flow 的背景信息包括由北京大学、快手科技和北京邮电大学共同研发,并且已经在多个平台上发布了相关的论文、代码和模型。

  • MLE-bench:机器学习工程能力的AI代理评估基准

    MLE-bench是由OpenAI推出的一个基准测试,旨在衡量AI代理在机器学习工程方面的表现。该基准测试汇集了75个来自Kaggle的机器学习工程相关竞赛,形成了一套多样化的挑战性任务,测试了训练模型、准备数据集和运行实验等现实世界中的机器学习工程技能。通过Kaggle公开的排行榜数据,为每项竞赛建立了人类基准。使用开源代理框架评估了多个前沿语言模型在该基准上的表现,发现表现最佳的设置——OpenAI的o1-preview配合AIDE框架——在16.9%的竞赛中至少达到了Kaggle铜牌的水平。此外,还研究了AI代理的各种资源扩展形式以及预训练污染的影响。MLE-bench的基准代码已经开源,以促进未来对AI代理机器学习工程能力的理解。

  • Momo XL:动漫风格图像生成模型

    Momo XL是一个基于SDXL的动漫风格模型,经过微调,能够生成高质量、细节丰富、色彩鲜艳的动漫风格图像。它特别适合艺术家和动漫爱好者使用,并且支持基于标签的提示,确保输出结果的准确性和相关性。此外,Momo XL还兼容大多数LoRA模型,允许用户进行多样化的定制和风格转换。

  • Coframe.com:利用OpenAI技术生成与品牌视觉一致的UI代码

    Coframe是一个利用人工智能技术进行网站优化和个性化的平台。它通过与OpenAI合作,开发了一种模型,可以生成高质量、视觉上与品牌一致的UI代码。这种技术的主要优点在于能够加速网站优化过程,使网站优化变得更快速、更经济,同时允许进行以前不可能的实验和个性化方法。Coframe的背景信息显示,它已经与OpenAI合作,在其博客上也有相关介绍。产品的价格和定位信息在页面上没有明确说明。

  • iPhone Photo [FLUX] (iPhone Realism) - v1 final:提高图片自然度和真实感的AI模型

    iPhone Photo [FLUX] 是一个基于LoRA技术的AI模型,旨在增强图像的真实感,特别是在模仿iPhone照片效果方面表现出色。它不仅能够提升iPhone拍摄的照片质量,也能为非iPhone照片增添自然和真实的视觉效果。该模型由Anibaaal开发,并于2024年10月2日发表,属于Civitai平台。模型的使用技巧提示为强度设置为1,并且有超过1000个赞和375个评论,显示出其受欢迎程度。

  • GR-2:先进的通用机器人代理

    GR-2是一个先进的通用机器人代理,专为多样化和可泛化的机器人操作而设计。它首先在大量互联网视频上进行预训练,以捕捉世界的动态。这种大规模预训练涉及3800万视频剪辑和超过500亿个标记,使GR-2能够在随后的策略学习中跨广泛范围的机器人任务和环境进行泛化。随后,GR-2针对视频生成和动作预测进行了微调,使用机器人轨迹。它展示了令人印象深刻的多任务学习能力,在100多个任务中平均成功率达到97.7%。此外,GR-2在新的、以前未见过的场景中表现出色,包括新的背景、环境、对象和任务。值得注意的是,GR-2随着模型大小的增加而高效扩展,突显了其持续增长和应用的潜力。

  • LlamaIndex.TS:构建LLM应用的框架

    LlamaIndex.TS是一个为构建基于大型语言模型(LLM)的应用而设计的框架。它专注于帮助用户摄取、结构化和访问私有或特定领域的数据。这个框架提供了一个自然语言界面,用于连接人类和推断出的数据,使得开发者无需成为机器学习或自然语言处理的专家,也能通过LLM增强其软件功能。LlamaIndex.TS支持Node.js、Vercel Edge Functions和Deno等流行运行时环境。

今日大家都在搜的词: