首页 > 业界 > 关键词  > 正文

阿里云推出第八代企业级实例g8i AI推理性能提升7倍

2024-01-12 10:44 · 稿源:站长之家

站长之家(ChinaZ.com) 1月12日 消息:阿里云推出了第八代企业级通用计算实例 ECS g8i,采用了阿里云自研的「飞天 + CIPU」架构体系和第五代英特尔至强可扩展处理器。新款实例的整机性能最高提升85%,AI 推理性能最高提升7倍,可以支持高达72B 参数的大语言模型。此外,ECS g8i 实例还提供了端到端的安全防护,为企业构建可信的 AI 应用提供了强大的隐私增强算力支持。

在通用算力方面,ECS g8i 实例的 L3缓存容量提升到320MB,内存速率高达5600MT/s,整机性能提升85%,单核性能提升25%。存储方面,ESSD 云盘提供100万 IOPS,全面搭载 NVMe,存储延迟低至百微秒。网络方面,PPS 高达3000万,标配阿里云自研 eRDMA 大规模加速能力,时延低至8微秒。安全方面,ECS g8i 实例支持可信计算与加密计算等特性,全球率先支持机密虚拟机 TDX 技术,构建了全面的安全防护。

微信截图_20240112104507.png

对于 AI 应用来说,ECS g8i 实例采用了 Intel AMX 高级矩阵扩展加速技术,将生成式 AI 的运行速度提升了7倍,可以更快地运行知识检索、问答系统和摘要生成等任务。配合阿里云 Spot 抢占式实例,成本优势将进一步凸显,降低推理成本。此外,基于自研 eRDMA 超低延时弹性网络,ECS g8i 实例集群可以支持高达72B 参数的大语言模型分布式推理,推理性能随集群规模接近线性加速,并且支持超过32batchsize 的超大参数规模的 AI 模型负载。

在安全方面,阿里云通过硬件可信根和虚拟可信能力 vTPM,实现了服务器的可信启动和实例启动过程核心组件的校验能力。此次升级的 ECS g8i 实例全量支持 Trust Domain Extension TDX 技术,为大模型等 AI 应用提供了隐私增强算力。

阿里云表示,ECS g8i 实例的强劲表现证明了以 CPU 为中心的计算体系同样具备加速 AI 推理的潜力,公共云不仅可以胜任超大规模的 AI 模型,还为 AI 应用加速落地提供了新的路径。

举报

  • 相关推荐
  • 真补贴、真落地!阿里云发布AI应用先锋计划,助力企业跑通AI第一程

    阿里云AI应用先锋计划通过“云+AI+行业适配”模式,助力企业突破AI落地瓶颈。该计划提供云资源补贴、POC服务、专家咨询及联合品牌推广等支持,降低企业AI应用门槛。结合端云协同架构,解决算力成本高、模型部署难等问题,已在智能硬件、教育、政务等领域实现案例落地,推动AI从技术尝鲜走向常态化应用。

  • 江波龙企业级存储:从SOCAMM技术落地看中国存储企业的硬实力

    2025年全球数字化浪潮加速,半导体存储市场迎来变革。中国企业江波龙凭借全链条存储解决方案能力,在数据中心、云计算、AI训练等核心场景取得突破。其即将推出的革命性产品SOCAMM采用LPDDR5X技术,带宽达传统DDR5的2.5倍,延迟降低20%,功耗仅为标准产品的1/3,并支持液冷技术优化数据中心PUE值。该产品通过14×90mm紧凑设计实现高密度部署,已与头部客户完成联合开发,未来将批量应用于NVIDIA Grace Blackwell等顶级平台。江波龙正加速构建"技术-产品-生态"闭环,第二代SOCAMM带宽将达400GB/s,并与戴尔、联想等厂商深化合作推动方案标准化。在绿色数据中心、边缘计算、智能驾驶等新兴领域持续拓展,有望成为全球存储新范式的定义者。

  • 阿里云AI火花大会:规模化前夜,AI务实派靠场景破局

    阿里云在深圳成功举办AI创新应用大会,提出要将"云+AI"技术转化为千行百业的商业动能。大会吸引了近千家企业参与,探讨AI技术从理论走向商业实践的路径。阿里云智能集团副总裁刘湘雯指出,AI不仅是技术演进,更是生产力革命。会议聚焦大模型与AI Agent的融合机遇,提出企业智能化转型需把握四大趋势:技术迭代加速、开源填补鸿沟、智能体从"工具人"变为"决策者"、交互革命重构人机触点。阿里云通过三层落地逻辑(模型API Server、Agent对接层、行业解决方案)助力企业穿透技术迷雾,并发布AI应用先锋计划,联合生态伙伴加速AI应用从概念验证到规模化落地。

  • 卓世联合致远互联共建企业级超级智能体 构建人智协同新范式

    8月9日,由致远互联主办的“2025协同管理论坛”在武汉光谷盛大举行。卓世科技创始人兼CEO屠静女士受邀发表主题演讲,并与致远互联携手共建全新企业级超级智能体平台。从多模态智能体集群的底层能力首秀,到“一句话搞定差旅、报表、会议总结、供应链计划”等沉浸式应用场景体验,从与致远互联产品体系的深度预集成,到联合百家伙伴共建协同AI生态,卓世科技将与千

  • Agentic AI落地加速:迈富时企业级智能体中台2.0,让 AI Agent成为企业 “数字员工”

    Gartner将代理型AI列为2025年十大战略趋势之首,预测到2028年15%的日常工作决策将由自主智能代理完成。迈富时发布的AI-Agentforce2.0企业级智能体中台,通过"技术赋能+场景落地"双轮驱动,构建了从模型能力到业务价值的闭环。该平台具有三大核心优势:1)"模型-应用-开发平台"三位一体架构;2)ChatBox+工作流双开发模式,支持快速部署;3)企业级安全保障,满足金融等敏感行业需求。已在保险、零售、供应链等领域实现规模化应用,最高提升37%销售转化率。该方案让企业能低成本打造专属数字员工团队,真正释放代理型AI的战略价值。

  • 华为擎云亮相第八届南方信息大会,助力行业数字化新未来

    第八届南方信息大会在广州开幕,聚焦"AI时代CIO的机遇与挑战"。华为擎云携智慧办公全场景解决方案亮相,推出首款搭载HarmonyOS 5的商用笔记本HM940,展示"1+2+3"鸿蒙办公架构:1个企业级鸿蒙系统+2个云专区+3大核心方向(管理/安全/生产力)。方案支持大型企业原子化能力开放和中小企业流程简化,通过端云协同实现数据跨设备流转。华为终端商用领域获"2025年度CIO优选数字化服务商"认证,未来将持续联合生态伙伴,推动企业数字化转型。

  • 中大型企业用工新方案:可覆盖核心业务岗位,尘锋AI员工助力工作效率10倍提升!引领企业业务增长新范式!

    文章介绍了尘锋AI员工如何帮助200人以上规模企业解决用工成本高、服务效率低等问题。该AI系统融合DeepSeek、文心一言等大模型能力,结合30+行业经验,可覆盖售前接待、销售报价等核心岗位,实现1个AI员工替代10个人工,提升线索利用率70%、售后人效50%。通过多Agent体系控制模型确保业务准确性,采用大模型+小模型动态选择机制平衡成本与效能。目前已在医疗、教育等行业应用,未来将推动"人+AI"用工模式,赋能企业营销-销售-服务全流程,提升获客效率和服务质量。

  • 华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖

    华为将于8月12日在2025金融AI论坛发布AI推理领域突破性技术成果。该技术有望降低中国AI对HBM高带宽内存的依赖,提升大模型推理性能,完善国内AI生态。HBM作为3D堆叠DRAM方案,具有高带宽、低延迟等优势,是高端AI芯片标配,但面临产能紧张和美国出口限制。国内厂商正探索Chiplet封装、低参数优化等替代方案。

  • “AI+云”双引擎! 华为云828即将来袭,开启企业智能升级新纪元

    华为云在828B2B企业节推出多项AI解决方案,助力中小企业数字化转型。其MaaS平台让企业快速调用AI模型,Flexus云服务提供高性价比算力,覆盖从技术到商业落地的全链路需求。活动期间推出万元礼包、抽奖免单等优惠,降低企业上云门槛。华为云通过"模型即服务"理念,将AI原生嵌入业务场景,同时提供安全可靠的云基础设施,帮助各行业企业实现智能化升级,加速"上云用数赋智"进程。

  • 华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源

    在2025金融AI推理应用落地与发展论坛上,华为重磅发布了其AI推理创新技术UCM(推理记忆数据管理器)。这项技术被业内视为有望重塑国内AI推理格局的关键突破。 UCM技术的核心在于其先进的KV Cache系统,通过融合多种缓存加速算法工具与精细的分级管理策略,高效处理推理过程中产生的大量记忆数据。这带来了多重显著优势:有效扩大上下文窗口,确保推理过程的高吞吐量与

今日大家都在搜的词: