首页 > 业界 > 关键词  > 正文

阿里云推出第八代企业级实例g8i AI推理性能提升7倍

2024-01-12 10:44 · 稿源:站长之家

站长之家(ChinaZ.com) 1月12日 消息:阿里云推出了第八代企业级通用计算实例 ECS g8i,采用了阿里云自研的「飞天 + CIPU」架构体系和第五代英特尔至强可扩展处理器。新款实例的整机性能最高提升85%,AI 推理性能最高提升7倍,可以支持高达72B 参数的大语言模型。此外,ECS g8i 实例还提供了端到端的安全防护,为企业构建可信的 AI 应用提供了强大的隐私增强算力支持。

在通用算力方面,ECS g8i 实例的 L3缓存容量提升到320MB,内存速率高达5600MT/s,整机性能提升85%,单核性能提升25%。存储方面,ESSD 云盘提供100万 IOPS,全面搭载 NVMe,存储延迟低至百微秒。网络方面,PPS 高达3000万,标配阿里云自研 eRDMA 大规模加速能力,时延低至8微秒。安全方面,ECS g8i 实例支持可信计算与加密计算等特性,全球率先支持机密虚拟机 TDX 技术,构建了全面的安全防护。

微信截图_20240112104507.png

对于 AI 应用来说,ECS g8i 实例采用了 Intel AMX 高级矩阵扩展加速技术,将生成式 AI 的运行速度提升了7倍,可以更快地运行知识检索、问答系统和摘要生成等任务。配合阿里云 Spot 抢占式实例,成本优势将进一步凸显,降低推理成本。此外,基于自研 eRDMA 超低延时弹性网络,ECS g8i 实例集群可以支持高达72B 参数的大语言模型分布式推理,推理性能随集群规模接近线性加速,并且支持超过32batchsize 的超大参数规模的 AI 模型负载。

在安全方面,阿里云通过硬件可信根和虚拟可信能力 vTPM,实现了服务器的可信启动和实例启动过程核心组件的校验能力。此次升级的 ECS g8i 实例全量支持 Trust Domain Extension TDX 技术,为大模型等 AI 应用提供了隐私增强算力。

阿里云表示,ECS g8i 实例的强劲表现证明了以 CPU 为中心的计算体系同样具备加速 AI 推理的潜力,公共云不仅可以胜任超大规模的 AI 模型,还为 AI 应用加速落地提供了新的路径。

举报

  • 相关推荐
  • 从消费级到企业级:中国存储企业江波龙的存储升级之路

    全球半导体存储市场正经历AI算力爆发与周期性复苏的双重变革。中国存储企业江波龙凭借技术创新,率先推出LPCAMM2和SOCAMM2内存模块,实现容量密度提升50%、功耗降低30%,切入超薄笔记本和AI服务器市场。其产品适配国产CPU,构建“自研主控+封测制造+全球品牌”生态壁垒,并进军智能汽车等边缘计算领域,以技术突破推动中国存储产业从消费级向企业级跨越,重塑全球竞争格局。

  • 亮相第八届进博会,三星以AI创新引领未来生活

    第八届中国国际进口博览会11月5日在上海开幕。三星聚焦人工智能创新,通过AI Home解决方案、Vision AI显示技术及Galaxy AI移动生态,全面展示在显示、智能家电、通信及物联网领域的前沿成果。现场展出115英寸Micro RGB电视、裸眼3D游戏显示器及超轻薄折叠手机等产品,将尖端科技转化为可感知的智能生活场景,传递其推动绿色可持续发展的品牌理念。

  • 下一代企业 AI 基础设施要来了?云天励飞与金蝶共建融合新范式

    11月4日,云励飞与金蝶在2025全球创见者大会上签署战略合作协议。双方将以企业数字化软件生态与国产AI算力底座为双引擎,打通“算力-软件-场景”全链路,推动AI推理能力融入企业数字化全流程,打造国内首个算力与软件生态深度融合标杆。未来计划联合推出软硬件一体化方案,共建实验室,聚焦技术攻关与行业创新,优化AI在企业管理中的应用体验,助力政企数字化智能化转型,为国产算力规模部署提供实践路径。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • 下一个万亿市场?企业级AI应用生态初现雏形

    企业级AI市场正经历从单一工具竞争向完整生态体系构建的深刻变革。Deep+X便携算力设备与AppMall.ai应用商城组成的软硬一体模式,将AI模型部署时间从48小时压缩至8分钟,解决了中小企业AI落地的核心痛点。该生态已汇聚超千个预训练模型,覆盖50多个应用领域,通过开发者激励体系形成飞轮效应。随着企业私有化部署需求增长,这种生态模式有望在未来三年催生万亿级市场,重塑产业竞争格局。

  • 腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》,筑牢智能体应用安全基座

    腾讯云与Gartner联合发布《企业级智能体产业落地研究报告》,提出智能体场景罗盘评估模型,覆盖金融、零售等14大行业100+应用场景。报告指出智能体正从辅助工具演进为关键业务引擎,同时企业面临安全、成本等落地挑战。腾讯云安全提供全生命周期技术保障,通过华住集团、绝味食品等案例展示智能体在提升效率、优化服务方面的显著成效,助力企业构建“高可靠、强防护”的智能体体系。

  • 三星BESPOKE AI系列家电亮相第八届进博会 全场景呈现有温度的家居生活

    11月5日至10日,第八届中国国际进口博览会在上海国家会展中心盛大举办。三星家电连续八年参展进博会,带来AI神 冰箱、AI神 黑钻热泵洗烘旗舰、AI神 黑钻衣物护理机在内的全系冰洗护产品,沉浸式呈现Bespoke AI技术带来的从饮食到洗护的全场景智慧家居生活。依托SmartThings平台,三星将冰箱、洗衣机等设备无缝连接,真正用AI守护生活,减轻家务负担,引领用户开启智慧便捷�

  • 昕诺飞亮相第八届中国国际进口博览会,以创新光科技点亮智慧未来

    昕诺飞在第八届进博会展示多项全球与中国首发产品,聚焦"以光筑梦,点亮未来"主题。重点呈现AI与照明深度融合的创新成果,包括飞利浦AI悦光伴系列智能家居方案、Interact City Flex道路照明系统及NatureConnect自然光方案。同时推出针对银发群体的安瑞系列健康照明产品,并首发环保吊灯等低碳设计。公司宣布与长三角国家技术创新中心达成合作,共同构建产业协同生态,推动照明行业向智能化、健康化、可持续方向转型。

  • 数巅完成数亿元pre-A轮融资,领跑企业级AI Agent赛道

    北京数巅科技完成数亿元Pre-A轮融资,由济和创投与赛富基金领投。资金将用于产品研发、国内市场深耕及国际市场拓展,强化其Data Agent技术在行业落地方面的领先优势。数巅推出企业级Data Agent解决方案,通过模块化架构整合海量行业知识与企业数据,精准识别用户需求,实现秒级响应与深度推理,满足企业数据分析、智能报告生成及业务决策等需求。该方案已在多家央国企及金融机构落地,查数准确率超99%,成为国内企业级智能体应用的重要里程碑。

  • 打破跨境合作信息壁垒,邓白氏首款C端产品“龙易查™”于第八届进博会发布

    2025年11月5日,邓白氏在进博会推出首款面向中国C端用户的企业信息查询平台“龙易查™”。该平台覆盖全球200多个国家、超8.5亿家企业数据,提供全球企业实时查询、境外股权穿透、企业付款洞察等功能,通过手机即可快速获取企业工商信息、风险数据等关键资料,助力用户跨境商业决策。产品还独家引入企业付款指数(PAYDEX®),直观评估合作方付款信用,帮助规避潜在坏账风险。邓白氏旨在通过数据透明提升商业韧性,重塑全球商业信任基础。

今日大家都在搜的词: