首页 > AI头条  > 正文

​AWS 推出 Trainium2 芯片,AI 计算成本降低 40%

2024-12-04 09:42 · 来源: AIbase基地

在2024年 AWS re:Invent 大会上,亚马逊网络服务(AWS)宣布推出基于 Trainium2芯片的 Amazon Elastic Compute Cloud(EC2)实例,正式提供给用户。这新实例在价格性能方面相比于上一代基于 GPU 的 EC2实例提升了30-40%。AWS 首席执行官马特・加曼表示:“,我很高兴地宣布 Trainium2驱动的 Amazon EC2Trn2实例的正式发布。”

image.png

除了 Trn2实例外,AWS 还推出了 Trn2UltraServers,并展示了下一代 Trainium3AI 芯片。Trn2实例配备了16个 Trainium2芯片,能够提供高达20.8petaflops 的计算性能,专为训练和部署具有数十亿参数的大型语言模型(LLM)而设计。

Trn2UltraServers 则将四个 Trn2服务器组合成一个系统,提供高达83.2petaflops 的计算能力,以实现更高的可扩展性。这些 UltraServers 拥有64个互联的 Trainium2芯片,能够满足客户在训练和推理过程中对计算能力的需求。AWS 计算与网络副总裁大卫・布朗表示:“Trainium2实例和 Trn2UltraServers 的推出为客户提供了解决最复杂 AI 模型所需的计算能力。”

AWS 与 Anthropic 公司合作,启动了名为 Project Rainier 的大规模 AI 计算集群,采用数十万个 Trainium2芯片。这一基础设施将支持 Anthropic 的开发,包括对其旗舰产品 Claude 的优化,以在 Trainium2硬件上运行。

另外,Databricks 和 Hugging Face 也与 AWS,利用 Trainium 的能力来提高他们 AI 产品的性能和成本效率。Databricks 计划利用这些硬件来增强其 Mosaic AI 平台,而 Hugging Face 则将 Trainium2集成到其 AI 开发和部署工具中。

Trainium2的其他客户包括 Adobe、Poolside 和高通。加曼提到,Adobe 在使用 Trainium2进行 Firefly 推理模型的早期测试后,结果非常令人满意,预计会节省大量。“Poolside 预计能与其他选择相比节省40%”,他补充道。“高通正在利用 Trainium2开发能够在云中训练并在边缘部署的 AI 系统。”

此外,AWS 还预告其 Trainium3芯片,该芯片采用3纳米工艺制程。基于 Trainium3的 UltraServers 预计将于2025年底推出,旨在提供比 Trn2UltraServers 高出四倍的性能。

为了优化 Trainium 硬件的使用,AWS 还推出了 Neuron SDK,这是一个软件工具套件,帮助开发者优化模型以在 Trainium 芯片上实现最佳性能。该 SDK 支持 JAX 和 PyTorch 等框架,使客户能够在最小代码修改的情况下将软件集成到现有工作流程中。

目前,Trn2实例已在美国东部(俄亥俄州)地区提供,未来将扩展到其他地区。UltraServers 目前处于预览阶段。

划:

🌟 AWS 推出 Trainium2实例相比于旧版 GPU 实例性能提升30-40%。  

💡 Trn2UltraServers 将多个 Trn2服务器结合,提供更强的计算能力,满足大型 AI 模型需求。  

🚀 AWS 与多家公司合作,推动 AI 技术的应用,助力客户在成本和性能上获得优势。

  • 相关推荐
  • 谷歌推出 250 美元的 AI Ultra 套餐,重新定义“高端”

    谷歌或许想把 AI Ultra 打造成一个精英创作者工具包,但它也可能正在重新定义“高端”:只是贵而已……

  • iQOO 15 Ultra首曝:首款骁龙8 Elite 2 Ultra旗舰

    iQOO将于年底推出iQOO 15系列旗舰手机,包含标准版和Ultra版。iQOO 15 Ultra将采用2K LIPO直屏,首批搭载骁龙8 Elite 2平台,配备潜望长焦镜头,支持无线充电和IP68防尘防水。相比上代,Ultra版回归直屏设计,新增主动散热风扇和潜望长焦,影像和性能大幅提升。采用全新LIPO封装工艺,通过优化显示驱动芯片和电路布局,大幅收窄边框。LIPO技术采用高密度连接设计,减少信号传输通道数量和长度,在保证信号稳定性的同时缩小边框宽度。iQOO 15 Pro预计10月亮相,将成为行业首款骁龙8 Elite 2 Ultra旗舰机型。

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • 小米平板 7 Ultra 发布:搭载玄戒 O1芯片 售价 5699 元起

    在小米15周年战略新品发布会上,小米平板7Ultra惊艳亮相。这款平板电脑被小米官方誉为“小米平板巅峰之作”,不仅在尺寸上成为小米迄今为止最大的平板,更在配置和性能上展现出强大实力。 从外观设计来看,小米平板7Ultra造型简约而不失时尚。其整体厚度仅为5.1毫米,边框宽度为3.95毫米,重量控制在609克,轻薄便携。正面搭载了一块14英寸3:2比例的OLED面板,分辨率高达

  • 苹果最强笔记本!MacBook Pro内测M3 Ultra芯片

    B站一位UP主在iOS18系统代码中发现了MacBook ProM3Ultra的踪迹。 目前苹果最高端的M3Ultra芯片仅在MacStudio上搭载,在售的MacBook Pro搭载的是M

  • 从CentOS到银河麒麟:鞍钢完成工业操作系统安全升级 计算效能提升40%

    5月21日,中国电子与鞍钢集团在深圳签署战略合作协议。双方将基于在信息化领域的多年合作成果,加快推动战略合作项目落地见效。此次合作将助力鞍钢集团数字化转型,推进新型工业化发展。鞍钢作为最早实现全流程信息化的钢铁企业,面临保障生产系统实时性与管理系统深度融合的双重挑战。通过与麒麟软件等企业深度协同,银河麒麟操作系统为鞍钢核心业务系统建立安全屏障,并与飞腾CPU协同优化提升40%计算性能。目前该系统已支撑鞍钢13个核心业务系统,构建起完整的网信生态闭环。该合作模式串联起芯片、操作系统等产业链关键环节,对制造业转型升级具有示范意义。

  • AI触控云台浩瀚V3 Ultra发布,首发AI多模态追踪模块,定义手机云台轻旗舰标准!

    6月6日,浩翰V3 Ultra智能影像稳定器正式发布。作为旗舰级产品,它搭载行业首创AI多模态万物原生跟拍技术,支持10米远程触控彩屏、AI可视化构图、360°无死角跟拍及三轴稳拍等功能。新品采用第九代iSteady增稳系统,折叠后体积小巧便携。配备22英寸触控彩屏,支持5米手势控制和隔空补光功能。售价999元起,同步推出含无线麦克风的创作者套装。浩翰深耕稳定器行业11年,产�

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 雷军用上玄戒芯片三件套:小米15S Pro、小米平板7 Ultra、小米手表S4

    快科技5月24日消息,雷军今天上午发文称,昨天下单的小米15S Pro已经收到,准备收藏起来,自己继续用工程测试机。同时他还表示:玄戒芯片三件套,我全部用上!”玄戒芯片三件套也就是前两天发布会上的三大新品,分别是:小米15S Pro、小米平板7 Ultra、小米手表S4 eSIM 15周年纪念版。其中,小米15S Pro、小米平板7 Ultra同步首发玄戒01,采用业界量产最先进的第二代3nm工艺,在仅109mm的狭小空间内,成功集成了190亿晶体管。CPU采用十核架构,分别是2*Cortex-X925超大核 4*Cortex-A725性能大核 2*Cortex-A725能效大核 2*Cortex-A520超级?

  • AICosts.ai深度评测:一站式AI成本管理解决方案

    随着ChatGPT等大模型的爆发式发展,企业AI支出正成为新的财务黑洞。AICosts.ai应运而生,这款专为AI密集型团队设计的成本管理平台,能聚合所有AI服务商的账单数据,提供可视化分析和优化建议。核心解决三大痛点:1)碎片化账单管理;2)异常监控;3)跨平台优化。通过实时仪表盘、多维筛选和预算预警等功能,某客户使用三个月后总支出降低28%。专业版定价49.99美元/月,特别适合月AI支出超1000美元的团队和使用多个AI服务的开发者。平台计划Q3推出Slack/Teams实时通知和AI优化方案自动生成功能。

今日大家都在搜的词: