首页 > 业界 > 关键词  > 正文

阿里云推出第八代企业级实例g8i AI推理性能提升7倍

2024-01-12 10:44 · 稿源:站长之家

站长之家(ChinaZ.com) 1月12日 消息:阿里云推出了第八代企业级通用计算实例 ECS g8i,采用了阿里云自研的「飞天 + CIPU」架构体系和第五代英特尔至强可扩展处理器。新款实例的整机性能最高提升85%,AI 推理性能最高提升7倍,可以支持高达72B 参数的大语言模型。此外,ECS g8i 实例还提供了端到端的安全防护,为企业构建可信的 AI 应用提供了强大的隐私增强算力支持。

在通用算力方面,ECS g8i 实例的 L3缓存容量提升到320MB,内存速率高达5600MT/s,整机性能提升85%,单核性能提升25%。存储方面,ESSD 云盘提供100万 IOPS,全面搭载 NVMe,存储延迟低至百微秒。网络方面,PPS 高达3000万,标配阿里云自研 eRDMA 大规模加速能力,时延低至8微秒。安全方面,ECS g8i 实例支持可信计算与加密计算等特性,全球率先支持机密虚拟机 TDX 技术,构建了全面的安全防护。

微信截图_20240112104507.png

对于 AI 应用来说,ECS g8i 实例采用了 Intel AMX 高级矩阵扩展加速技术,将生成式 AI 的运行速度提升了7倍,可以更快地运行知识检索、问答系统和摘要生成等任务。配合阿里云 Spot 抢占式实例,成本优势将进一步凸显,降低推理成本。此外,基于自研 eRDMA 超低延时弹性网络,ECS g8i 实例集群可以支持高达72B 参数的大语言模型分布式推理,推理性能随集群规模接近线性加速,并且支持超过32batchsize 的超大参数规模的 AI 模型负载。

在安全方面,阿里云通过硬件可信根和虚拟可信能力 vTPM,实现了服务器的可信启动和实例启动过程核心组件的校验能力。此次升级的 ECS g8i 实例全量支持 Trust Domain Extension TDX 技术,为大模型等 AI 应用提供了隐私增强算力。

阿里云表示,ECS g8i 实例的强劲表现证明了以 CPU 为中心的计算体系同样具备加速 AI 推理的潜力,公共云不仅可以胜任超大规模的 AI 模型,还为 AI 应用加速落地提供了新的路径。

举报

  • 相关推荐
  • 华为云GaussDB将接入全球首个通算超节点 性能提升2.9倍

    华为在第十届全联接大会上发布基于TaiShan950超节点的GaussDB多写架构,性能提升2.9倍,每分钟可处理540万笔事务。该架构实现计算、内存、存储三层资源池化,支持秒级故障恢复,可平滑替代传统数据库。GaussDB已应用于金融、政务等关键行业,在中国数据库市场以13.9%份额首次超越Oracle登顶。华为通过20余年研发实现全栈自主创新,标志着中国数据库技术从跟随到引领的关键跨�

  • 两步生成企业级Agent,华为云Versatile平台打通智能体落地最后一公里

    华为在2025全联接大会上发布企业级智能体平台Versatile,通过极简流程实现企业级Agent开发,仅需输入业务逻辑与流程图即可完成,效率提升10倍。同时公布昇腾芯片未来三年规划,将陆续发布多款高性能芯片。华为云还推出超节点产品Atlas系列,算力全球领先。CloudMatrix384 AI+Token推理服务全面上线,吞吐量达2400TPS,性能远超业界水平。该平台已与多个行业合作,助力企业构建数字化AI产线,实现业务效率飞速提升。

  • AI火花集|从“听命令”到“懂人心”,阿里云携手嘉兴声芯拆解智能语音落地路径

    未来AI硬件将突破“机械响应”局限,语音交互成为核心入口。行业数据显示语音设备出货量激增,72%用户偏好语音交互。智能硬件面临算力不足、模型难选、成本高等挑战。嘉兴声芯通过端云协同方案,在本地处理隐私数据,云端进行语义理解,实现高效安全的语音交互。该方案已在AI玩具、车载后装等场景落地,推动硬件从工具向智能伴侣转型。

  • 国内知名外设品牌前行者即将联袂电竞职业冠军战队,打造职业级性能外设新标杆

    全球知名电竞外设品牌前行者(EWEADN)近日宣布与国内电竞赛事冠军队达成深度合作,共同开启“战术竞技装备升级计划”。此次强强联合不仅是其“电竞生态赋能”战略的关键落子,更将为玩家带来经职业赛场验证的“终极装备解决方案”。前行者深耕电竞外设,产品以高性价比和创新设计深受用户喜爱,销量超100万台,其高性能鼠标系列更以旗舰芯片和20000FPS竞技固件等硬件优势,让普通玩家也能享受职业选手级别的装备体验。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型;迪士尼将起诉MiniMax

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、版权、开发工具等领域的快速演进与应用创新。

  • Arm 全新 Lumex CSS 平台实现两位数性能提升,驱动消费电子设备“更智能、更高效、更个性化”

    Arm推出Lumex CSS平台,集成SME2技术CPU和Mali G1-Ultra GPU,实现端侧AI性能五倍提升。支持智能助手、语音翻译等实时应用,覆盖主流移动操作系统和AI框架。开发者可通过KleidiAI无缝调用SME2加速能力,无需修改代码。该平台专为旗舰设备设计,提供个性化、高隐私保护的本地AI体验,重新定义移动端交互与游戏性能。

  • AI员工正在赋能千行百业,企业在选择AI员工时,应该重点对比这4项重要能力!

    国务院发布《关于深入实施“人工智能+”行动的意见》,明确AI与实体经济、社会各领域深度融合成为国家战略。文章指出企业应重点考察AI员工的业务适配性、执行能力、系统对接能力和持续进化能力,选择能深度理解行业逻辑、完成真实任务、无缝对接现有系统并持续学习的AI工具,以提升效率、解放人力,把握智能化转型机遇。

  • 卓世科技荣膺国家级重点 “小巨人” 企业称号

    卓世科技凭借在工业互联网领域的专业化、精细化、特色化发展,成功入选国家级重点“小巨人”企业。公司专注人工智能大模型与行业智能化解决方案,构建了以“瑶光玉衡大模型”为核心的全栈技术体系,在工业设备管理、生产流程优化等领域形成专业方案。通过持续研发投入和产学研合作,累计获得发明专利百余项,推动AI技术在智能制造、政务服务等多元场景落地。此

  • 华为云:做厚算力“黑土地”,成就行业AI先锋

    华为全联接大会2025上,华为云发布多项AI创新成果,包括CloudMatrix 384昇腾AI云服务全面上线,支持超大规模AI集群,算力提升显著。推出EMS弹性内存存储服务,降低大模型对话延迟。同时,华为云在贵州、内蒙古等地部署全液冷AI数据中心,PUE低至1.1,实现高效智能运维。盘古大模型已在30多个行业、500多个场景落地,覆盖政务、金融、制造等领域。华为还推出企业级Agent平台Versatile,提升开发效率,并发布R2C协议,推动云端一体化机器人发展。此外,华为云通过全球存算网、数据赋能及一站式AI开发平台,助力企业实现智能化转型。

  • 云客AI工作手机,亮相全球数字经济大会,为企业筑就数据与管理的新基座

    2025全球数字经济大会上,云客作为智能销售管理解决方案代表企业,由COO罗毅发表主题演讲。演讲聚焦企业数字化转型中的销售管理失焦与效率瓶颈问题,提出通过AI重构销售工作流,实现管理可控性与人效最大化。云客AI工作手机通过自动化数据采集与合规沉淀,确保数据真实可追溯,赋予管理者“上帝视角”实时把控全局,同时为一线人员提供智能训练支持。该方案显著降低运营成本,提升销售触达规模与转化效率,为企业构建可持续增长引擎,助力中国销售数字化转型。

今日大家都在搜的词: