首页 > 传媒 > 关键词  > 腾讯云智算最新资讯  > 正文

腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

2025-09-23 14:41 · 稿源: 站长之家用户

9月17日,在2025年腾讯全球数字生态大会Agent+Infra专场,腾讯云副总裁李力宣布腾讯云智算全面升级。腾讯云智算面向“更贴近AgentAI Infra”建立包括Agent Infra解决方案Agent Runtime+云专家服务智能体Cloud Mate与全链路安全能力为一体的完整解决方案,帮助Agentic AI 从“实验室”走向“生产级”。

李力表示,“同源同构”是贯穿腾讯云产品设计与服务能力的核心原则,也是其应对行业需求、面对技术变革、支撑全球化布局的关键逻辑。这一原则包含双重核心内涵:一方面,以一致的代码体系、服务标准与产品特性,同步服务腾讯微信、QQ、游戏等自研业务与外部客户,通过“自用自验”提前解决技术痛点,向行业客户交付成熟的技术与服务;另一方面,实现公有云、专有云、边缘计算、分布式云及国内外服务的能力统一,即便海外开区,机房标准与功能体验也与国内完全一致,保障全球化服务的一致性。

这一云计算时代坚守的原则,在智算领域展现出更大的价值:例如在存储层面,腾讯云凭借十年来打磨的CBS、CFS等存储产品,即可完美匹配AI对存储的性能需求,而无需推导重构一套适配于智算时代的存储底座。可以说,智算的兴起进一步凸显AI原生云的优势。李力强调,“同源同构”是腾讯云IaaS体系的核心调性,它不仅是产品技术层面的标准,更是腾讯云在AI Agent时代为客户提供稳定服务、支撑全球化拓展的底层逻辑,也为客户降低跨场景、跨区域的技术适配成本。

他认为,与AI时代相比,Agent时代对Infra的需求出现了全新的变化。未来两年,部署AI Agent的企业数量将翻番,相关支出增幅将达到192%。按照行业惯例,云基础设施的建设支出,将会比AI Agent的支出更大。大量企业将会提前投资、储备云基础设施,已适配业务需求的重大变化。但部分企业仓促落地的智算中心,往往采购大量高端硬件设备,但却因为配套设施(存储、网络、安全、运维等)建设上的之后,陷入闲置风险。这不仅导致成本与时间的巨大消耗,也会导致错失关键市场窗口期。

要解决这个现状,就需要注意到AI Agent时代对Infra提出的新要求。一是更快的模型推理效率。这意味着除了提供“又快又稳”的底层能力之外,Infra还需要具备更贴近业务、从底层“向上”辐射的价值。为了让模型推理更快,可以基于云的角度去做一些探索,在Infra底层技术和工程创新上帮助AI落地更加顺畅。二是更灵活的工具集成。实际上在部署和运行Agent的过程中,Agent本身就是一个工具,能调用哪些工具,是否好用也没有明确的目标。但最终的目的,是像人的手脚一样,能够形成工具的集合,在一个工具自动运行的时候,其他工具能够协同辅助,让Agent延展的更广,得以体现它的智能优势。三是稳定的系统保障。在通用计算场景下,业务和底座是分离的。但到了智算时代推理阶段,模型和业务天然绑定在一起。假设企业的核心业务已经在云上跑,要把它迁移到智算平台,那就会对存储、网络、中间件提出巨大挑战,对平台的系统保障提出了非常高的要求。

针对智算时代的新需求、新挑战,腾讯云智算提出要成为“更贴近Agent的智能引擎”。它包括AI Infra灵活底座+AI Infra多元硬件、AIinfra高性能软件,以及全新升级发布的Agent Infra解决方案“Aggent Runtime”、云专家服务智能体“Cloud Mate”以及全链路安全能力。

在底座上,腾讯云智算持续进行优化提升,成为更贴近Agent的AI原生云。在硬件层面,支持一云多芯、软硬协同,支持多样硬件生态,支持自研及第三方交换机;在软件层面,提供大语言模型加速(TACO-LLM推理效率提升100~130%)、文生图模型加速(TACO-DIT推理效率提升122%)、推理集群即服务(HAI分钟级拉起满血模型,高缓存命中)等核心升级。他举例说,基础设施的升级能够显著影响客户体验。例如在游戏场景频繁扩缩容、或者终端厂商提供模型服务切换底层模型的场景,都高度依赖云平台的扩缩容速度。而腾讯云历史上沉淀的创建速度快的优势,在智算时代继续成为了客户认可的禀赋。

在模型推理层面,腾讯云智算高性能软件的升级,能够助力推理集群性能发挥到极致。一方面,实现模型启动效率的飞跃——依托HML去中心化加速模型拉取、RDMA高速网络与GooseFS等,大规模扩容场景下整体服务拉起时间从10分钟大幅压缩至34秒,模型启动速度提升17倍,让AI服务能像消费电子设备般“即开即响应”;另一方面,在多模态推理加速上实现突破:腾讯自研的TACOKit推理加速引擎,通过文生图并行化处理等技术,使生文、生图、生视频模型,在大部分场景下性能提升4倍以上,有力支撑客户海量图像生产、快速创意迭代的需求。借助全局共享KV缓存、TRMT通讯协议、PD分离部署、模型量化等底层技术优化,客户无需额外适配,就能获得极致推理速度,大幅降低AI推理能力落地的技术门槛。

在工具集成层面,腾讯云智算全新发布Agent Runtime云沙箱,为Agent提供安全隔离的执行环境。Agent Runtime脱胎于腾讯云原生已有的体系,实现Infra服务的极致无缝化。它能快速创建运行环境,支撑大规模Agent应用落地;它将基建运维做到“极致无感”,用户无需关注底层资源调度逻辑,计算资源会按需“凭空出现”,完成任务后自动释放,全程无需手动开关机或配置环境。

在系统守护方面,腾讯云智算发布Cloud Mate云专家服务智能体,基础设施向主动服务跃进。李力说,AI让Infra变得更智能,更可靠,具备“主动服务”的特性。Cloud Mate 云专家服务智能体以实时监控、操作审计、资源配置、日志等基础能力为底座,结合预测与诊断模型,再通过自动化执行工具,构建起“源头风险预防-运营风险规避-智能运维”的全链路主动服务能力。一方面,能对云环境中SQL性能瓶颈、潜在安全漏洞等进行智能预判与精准诊断提前拦截高峰扩容等场景下的隐性风险;另一方面,借助AI从海量日志中自发挖掘潜在问题并推动专家响应,让海量服务器与算力资源的管理更可控、更智能。在实践中,Cloud Mate已经能够实现3分钟快速诊断,准确率超过95%。

机器人正在成为AI发展落地的重要方向,但具身智能也面临着显著挑战。一方面,具身智能缺乏大语言模型所具备的天然、开放、海量的数据,而具身数据和硬件高度绑定,对数据质量的要求极高;另一方面具身智能依赖的多模态感知,需要整合图像、文字、声音甚至触感等多元信息,实现综合交互的作用。腾讯依云通过HAI推理集群联合自研具身智能产品Tairos,提供具身感知与规划模型服务,以“多模态、全托管、独享算力、安全稳定”为核心特性,为机械臂、人形机器人等设备打造专属、跨本体的“云上大脑”。

李力介绍说,腾讯云智算还在通过一些基于AI的特性解决开发领域中的一些难题。推出OrcaTerm AI原生智能终端,以AI整合服务器环境信息为核心,支持脚本生成、应用部署、业务排障等全流程操作,让服务器“带内”操作如自然对话般简单。这个探索产品上线后,很快就实现了数万日活、用户平均停留数个小时的好成绩。在轻量云服务器等产品探索AI化服务,解决传统海量文档对用户的过度消耗。

李力表示,目前,腾讯云智算已经服务了国内90%的大模型厂商,并为交通出行、工业制造、教育培训、具身智能、医疗健康、金融保险等千行百业提供了高效、好用的云智算解决方案。腾讯云希望,通过Infra让AI变得更好,也通过AI让Infra变得更好。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 从“实时分账”到“智能问数”:汇付天下以“Data Agent”重塑支付业务决策效率

    汇付天下作为技术驱动的数字化企业,践行“数字化+国际化”战略,为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求,公司依托火山引擎技术,构建湖仓一体架构,实现毫秒级风控响应与实时分账,并通过Data Agent智能平台支持自然语言查询与业务归因,推动数据驱动运营。该方案以流批一体能力优化数据处理效率,保障业务稳定与合规,助力企业实现全域增长与智能化风控协同。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 国内首个!火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

    火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系,同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点,确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度,通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制,为数字化转型深水区企业提供选型优化依据,推动产业智能化进入精准量化新阶段。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 蝉妈妈AI新品震撼发布:电商营销Agent时代来临,6万+从业者共寻增长新引擎

    2025年电商竞争核心转向AI效率。蝉妈妈于10月23日发布电商专属AI工具,旨在解决传统运营痛点。该工具覆盖全链路场景:从行业分析、竞对数据到图文创作、视频脚本生成,帮助从业者实现策略制定到落地执行的一站式智能运营。发布会集结多位实战专家,分享全域增长、内容提效等可复用的方法论,吸引超6万观众。蝉妈妈凭借行业数据沉淀与AI技术结合,为电商从业者提供突破增长瓶颈的系统路径,推动行业迈向技术驱动的高效新纪元。

  • 零一万物联合开源中国推出OAK平台,目标打造Agent世界的“生态适配器”

    在GOT C 2025全球开源技术峰会上,零一万物CEO李开复博士发表演讲,强调开源模型是构建AI Agent的最佳选择。零一万物与开源中国联合发布一站式AI Agent开源开发平台OAK,支持对接多种开源大模型,旨在打破生态绑定限制,助力开发者实现“Agent开发自由”。该平台具备可视化编排、评估优化、数据管理等功能,未来将逐步推出四大核心模块,推动开放协作的AI Agent生态发展。

  • 腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》,筑牢智能体应用安全基座

    腾讯云与Gartner联合发布《企业级智能体产业落地研究报告》,提出智能体场景罗盘评估模型,覆盖金融、零售等14大行业100+应用场景。报告指出智能体正从辅助工具演进为关键业务引擎,同时企业面临安全、成本等落地挑战。腾讯云安全提供全生命周期技术保障,通过华住集团、绝味食品等案例展示智能体在提升效率、优化服务方面的显著成效,助力企业构建“高可靠、强防护”的智能体体系。

  • 没有Pro Max!一加Ace 6T命名敲定:首发骁龙8 Gen5

    此前有网友在机场拍到一加Ace 6 Pro Max包装盒,不少网友认为这就是一加即将推出的骁龙8 Gen5新机。 博主数码闲聊站表示,一加骁龙8 Gen5新机不叫Ace 6 Pro Max,而是命名为Ace 6T,这里的T不是Turbo,是一加纯正的性能基因,一加的Turbo系列也已在路上了。 对比一加Ace 6,一加Ace 6T处理器由骁龙8 Elite换成了骁龙8 Gen5,电池容量突破8000mAh,还将带来炫酷的联名。 该博主还爆料,高通

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 腾讯云领跑中国游戏云市场,用量规模持续多年第一!

    IDC报告显示,2025年上半年腾讯云在中国游戏云市场持续领先,用量规模稳居第一,收入增速位列前三。凭借深厚技术积累,腾讯云在基础设施、云游戏接入、资源分发等细分赛道均获第一,构建了覆盖游戏全生命周期的解决方案。同时,腾讯云积极整合AI能力,推出升级版全周期方案,通过代码生成、智能运营等提升开发效率,助力游戏企业提质增效,并与《卡拉彼丘》等项目合作,验证了其技术实力,推动游戏产业创新与全球化发展。

今日大家都在搜的词: