首页 > 传媒 > 关键词  > AI技术最新资讯  > 正文

腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座

2025-06-09 18:13 · 稿源: 站长之家用户

随着生成式AI技术的爆发式增长,AI大模型开始渗透至手机领域,一线厂商已经把AI应用集成到各自最 新的产品中,并且在以惊人的速度迭代。为了进一步提升大模型部署的效能,荣耀基于应用腾讯云TencentOS Server AI中提供的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,并应用荣耀企业内部等场景,稳定性、可靠性、推理性能均大幅提升。

在推理平台场景中,荣耀侧重关注框架效能、稳定性、运行状态监控及应急预案等特性。使用TACO-LLM进行推理任务后,在DeepSeek-R1满血版场景下,相对于荣耀原始线上业务性能,TTFT(首Token 延迟)P95的响应时间最 高降低6.25倍,吞吐提升2倍,端到端延迟降低100 %。在社区最 新版本sglang场景下,TTFT P95的响应时间最 高降低12.5倍。

腾讯云TACO-LLM之所以能够对荣耀业务的性能提升如此明显,主要的得益于多种投机采样技术核心能力:大语言模型的自回归解码属性无法充分利用GPU的算力,计算效率不高,解码成本高昂。而TACO-LLM通过投机采样的方式,从根本上解决了计算密度的问题,让真正部署的大模型实现“并行”解码,从而大幅提高解码效率。

荣耀大数据平台部相关负责人表示:“荣耀使用腾讯云 TACO-LLM 打造高性能的AI底座,部署稳定可靠,提升了性能加速体验。”

TencentOS Server AI加速版中提供的TACO-LLM加速模块,针对企业级AI模型私有化部署挑战,对大语言模型业务进行了专门的内核运行优化,用于提高大语言模型的推理效能,提供兼顾高吞吐和低延时的优化方案,能够“无缝”整合到现有的大模型部署方案中。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 国内独家AI+操作系统TencentOS Server亮相2025中国国际金融展

    腾讯云TencentOS+Server历经15年技术积累,打造了国内独家AI+操作系统,已在农业银行、招商银行等金融机构核心系统落地应用。该系统具备性能提升、安全稳定等关键能力,支持国产CPU深度优化,实测性能提升9%-25%。其推出的TACO-LLM大模型推理加速器显著降低延迟,在金融信创生态实验室评测中获得权威认证。作为OpenCloudOS社区核心贡献者,TencentOS+Server已适配1697款硬件,覆盖四大架构,并孵化云原生OS"玄湾"等创新项目,成为国产操作系统规模化应用的标杆。

  • 首届央国企数智化与转型战略成果发布会在京召开,TencentOS Server展示应用成果

    6月26日,首届央国企数智化转型战略成果发布会在京举行,发布《央国企数智化发展研究报告》等重要成果。腾讯云受邀参会,其自研操作系统TencentOS Server凭借"西游四件套"等创新技术方案获得关注。该系统已实现超1000万套部署,支撑金融、政务等行业国产化需求,具备三大优势:1)性能提升方面,CPU利用率提升15-45%,整机能耗降低5-10%;2)技术创新方面,独创qGPU虚拟化技术可降低60%硬件成本;3)生态适配方面,已完成与国产主流硬件的互认证。目前该系统已助力农业银行等金融机构实现5%-25%性能提升,并成为金融、党政领域首选方案。作为国内三家具备Linux研发能力的厂商之一,腾讯云将持续打磨技术,支撑企业数字化转型需求。

  • 忆联 Docker+MySQL 流控方案:打造安全高效存储底座,释放 AI 极致性能

    文章探讨了在AI时代背景下,基于Docker部署MySQL数据库的高效解决方案。通过Docker容器化技术,MySQL实现了灵活部署、资源高效利用和稳定隔离性,成为AI应用的首选数据库方案。测试结果显示,采用PCIe5.0企业级SSD配合Namespace技术和QoS优化策略,能精准控制性能偏差在2%以内,在混合读写场景下更可控制在1%以内。该方案显著提升了存储资源管理效率,为AI应用提供稳定可靠的数据存储支持,同时降低企业TCO成本,推动数据价值释放。

  • 再获认可!腾讯云凭借NDR入选Forrester最新研报

    国际权威机构Forrester发布《网络分析与可见性解决方案报告》,腾讯云凭借旗下NDR产品在威胁检测、自动化响应等方面的优势连续第二年入选。报告指出,随着数字化转型深入,企业面临东西向流量攻击、AI驱动攻击等新型威胁,NAV解决方案能提供全网流量实时洞察,快速发现威胁。腾讯云NDR具备检测场景全、响应快、阻断率高等优势,覆盖公有云和线下机房全流量检测,支持2000余项漏洞检测,并采用AI算法提升威胁发现能力。报告建议企业根据规模选择合适的NAV供应商,腾讯云以"云原生接入、全流量检测、全流量可视"三大创新突破,助力企业构建高级威胁防护能力。

  • 破解高密散热难题, 维谛技术(Vertiv) 360AI混合制冷方案重塑AI时代热管理

    文章主要探讨AI大模型训练带来的高温危机及解决方案。随着GPU集群全功率运转,数据中心面临前所未有的散热挑战,单机柜功率密度突破10kW,传统散热手段力不从心。维谛技术(Vertiv)提出"360AI高效混合制冷方案",整合风冷、液冷和自然冷却三种方式,构建全链路温控体系。方案覆盖从服务器到户外的不同场景需求,包括风液混合型、液液CP组合等多元方案,能精准应对10-130kW不同功率密度需求。同时,维谛推出业界首创风液氟泵一体机,支持快速部署,并创新研发适配AI的自然冷高温冷机,单框架制冷能力近3MW。该方案兼顾算力需求与节能政策要求,为智算时代构建更可靠的温控底座。

  • Agent成了腾讯AI最大的牌面

    抓住DeepSeek带来的契机扭转AI领域的竞争态势之后,腾讯围绕AI应用的布局正在快速深化。 元宝、ima等原生AI应用是腾讯进行探索的最前线。腾讯元宝通过大规模市场投入获得用户增长后,继续拓展了更多能力,包括将元宝放入微信好友列表,打通与腾讯地图、腾讯文档的连接,以及上线Chrome浏览器插件。腾讯管理层目前还在观察用户对这些新增功能的反馈,判断哪些功能可以�

  • 天悦康康:AI赋能打造可验证的CBT-I睡眠疗法

    文章介绍了睡眠科学的重要性,指出传统助眠方式依赖主观经验而缺乏数据验证。重点介绍了天悦康康基于世界睡眠医学会认证的CBT-I(失眠认知行为疗法)构建的智能睡眠管理系统,通过智能指环精准监测睡眠数据,结合AI分析提供个性化睡眠改善方案。其创新在于将CBT-I的认知调整(改变错误睡眠观念)和行为训练(建立健康习惯)数字化,形成"数据监测+CBT-I模型+科学干预"的完整闭环。产品还具备睡眠银行、AI伴睡等特色功能,通过可视化数据和正向激励帮助用户养成规律作息,实现睡眠质量的可持续提升。

  • MCP server资源网站去哪找?国内MCP服务合集平台有哪些?

    在人工智能飞速发展的今天,AI模型与外部世界的交互变得愈发重要。一个好的工具不仅能提升开发效率,还能激发更多的创意。今天,我要给大家介绍一个宝藏平台——AIbase(<https://mcp.aibase.cn/>),一个专注于MCP(Model Context Protocol)服务的全球集合平台,它正在悄然改变AI应用开发的格局。 平台精心挑选了全球最受欢迎的MCP服务进行推荐。这些服务经过了市场的检验,具�

  • 从车企CIO视角看Testin云测的智能座舱AI测试实施案例

    文章探讨了智能座舱成为车企差异化竞争核心的趋势。2024年数据显示,智能座舱故障率高居新能源汽车投诉首位,暴露传统测试模式在复杂系统下的不足。以Testin云测为代表的AI测试服务商通过三大技术重构测试体系:1)视觉引擎实现跨系统界面识别,测试效率提升3倍;2)缺陷预测模型使65%问题在开发阶段暴露,降低后期修复成本50%;3)云端设备池化使硬件利用率从30%提升至65%。某头部车企案例显示,该方案使测试效率提升35%,缺陷检出率提高55%,年节省测试费用超千万元。未来趋势将向AI深度渗透、虚实结合测试和全生命周期管控发展。

  • MCP协议资源服务去哪找?国内MCP server资源网站推荐

    ​在人工智能技术飞速发展的今天,AI模型与外部工具和服务的交互需求日益增长。为了满足这一需求,一个名为 AIbase 的全球MCP服务器集合平台(https://mcp.aibase.cn/)应运而生,为开发者和企业提供了前所未有的便利和强大的功能支持。