首页 > 传媒 > 关键词  > 云主机最新资讯  > 正文

天翼云与欧拉社区共研支持aarch64及x86平台libcareplus热补丁功能

2022-06-10 16:55 · 稿源: 站长之家用户

近日,中国电信天翼云基础架构技术团队与openEuler社区合作共研了全面支持aarch64及x86平台的libcareplus热补丁功能,并为欧拉社区贡献首个C++热补丁,实现主机崩溃在线修复。这是天翼云与欧拉社区联合开展关键技术创新取得的又一成果。

之前双方已成功研发了基于Libcareplus工具的Qemu热补丁功能。据天翼云科技有限公司副总经理兼首席技术官广小明在今年4月欧拉大会上介绍,Qemu热补丁功能使主机分批串行升级转变为并行同步升级,支撑现网补丁实施周期由月缩减到周,极大缩短了补丁的实施周期。

目前,新研热补丁工具普适性已得到极大提升,应用场景更广泛。而作为落地应用之一,天翼云为欧拉社区贡献的首个C++热补丁实现了云主机不用重启修复bug的能力,保障客户业务不中断,真正做到“为飞行中的飞机更换发动机”。

热补丁技术能够在不影响现网业务的情况下完成程序修复、适用于需要快速响应的场景,可谓是短小精悍。其中libcareplus热补丁技术更是集万千宠爱于一身。

据了解,ibcareplus热补丁技术是基于上游社区libcare独立发展的分支,由openEuler社区进行自主孵化,主要包括热补丁制作、补丁管理和补丁加/卸载等。相比于上游社区的libcare,libcareplus作为一个用户态进程热补丁框架,可以在不重启进程的情况下,支持对x86和aarch64架构中Linux系统上运行的目标进程进行热补丁操作。同时,libcareplus全面支持openEuler Qemu组件,支持函数级过滤、增量补丁、以及补丁文件解析等。

此次天翼云联合欧拉社区打造的libcareplus热补丁功能,可以应用于CVE漏洞修复,也可应用于不中断应用服务的紧急bug修复。

而且在合作研发过程中,天翼云基础架构技术团队还针对全局变量、局部静态变量等热补丁功能缺失的痛点进行深度研发。以前增加全局变量补丁会导致目标进程崩溃,只能采用分配内存等方式规避,经优化后增强了补丁代码的易修改和易维护性。这些功能成功适配多个主流Qemu版本,大大提高了libcareplus热补丁工具的适用性,为大规模批量应用奠定了坚实的基础。

同时在实际业务应用场景中,天翼云发现libcareplus在处理g++高版本生成的汇编文件时,在汇编文件比对和生成过程中,代码块结构划分异常,进而导致生成的汇编文件无法被as汇编器正确解析。天翼云联合欧拉社区针对该场景进行优化创新,基于欧拉社区libcareplus 扩展增加支持g++8特性,实现libcareplus支持C++软件热补丁制作及管理能力。

目前,该特性源码及单元测试用例已贡献到欧拉社区,并在欧拉社区虚拟化SIG组进行技术分享,相关特性已被欧拉社区收录至22.03LTS发行版。

新研热补丁工具普适性增强,应用场景更加广泛

经过天翼云基础架构技术团队与openEuler社区共同优化后,libcareplus热补丁工具的应用场景得到了极大的扩展。

1.为单函数修改制作单个补丁

2.为多个函数修改制作多个补丁

3.新增函数

4.新增全局变量

5.TLS变量

6.冷热块重排

加速联创技术落地 天翼云为欧拉社区贡献首个C++热补丁

对很多用户来说,最怕在业务办理过程中突然中断、等待修机,但这种现象却不时发生。当欧拉系统下的云主机出现Qemu崩溃时,通常情况下该问题可以通过重启云主机冷补丁方式进行修复,但会带来客户业务出现短暂的中断。

为了解决线上部分Qemu crash导致云主机重启问题,中国电信天翼云弹性存储技术团队深入代码分析,发现原生librbd存在严重的代码bug。为了保证客户云上业务连续不中断,提供更高的云存储可用性,中国电信天翼云弹性存储技术团队通过不断反复验证和实验,利用libcareplus C++热补丁技术,librbd热补丁代码在不进行换行、不新增接口的情况下,通过代码数据结构,计算变量在内存中的地址偏移的方式对代码进行修复,最终在内存中更新librbd补丁,实现不需重启虚拟机打librbd热补丁能力,即云主机不用重启也能修复bug的能力,既保障客户云上业务连续性又大大缩短运维时间,真正做到了“为飞行中的飞机更换发动机”。

目前,该项热补丁技术成为了欧拉社区第一个C++热补丁,已在南宁、昌吉、兰州等资源池正式上线,部署超过10万台云主机,覆盖金融、医疗、政企等众多行业客户。

未来,天翼云将与欧拉开源社区持续合作,开展更多联合创新,包括在提升云主机资源利用效率方面,开展虚拟机高低优先级混部、容器在线离线混部创新;在可信云主机方面,开展机密计算创新;在DPU卸载上,开展分布式存储卸载、容器网络卸载创新;在云原生全栈方面,开展安全容器、KubeEdge 边云协同创新等。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出面向Agent的AI基础设施解决方案。腾讯云副总裁李力强调“同源同构”为核心原则,通过统一技术架构支撑自研业务与外部客户,实现产品标准化与全球化服务一致性。升级方案包括Agent Runtime云沙箱、Cloud Mate智能运维体及全链路安全能力,旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力企业降低AI应用门槛。李力指出,未来两年AI+Agent部署将大幅增长,腾讯云已服务国内90%的大模型厂商,并为多行业提供高效智算支持。

  • 腾讯云李力:坚持同源同构,为企业打造更贴近Agent的AI原生云

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出“更贴近Agent的AI+Infra”解决方案,包括Agent+Runtime、云专家服务智能体Cloud Mate及全链路安全能力。腾讯云副总裁李力强调,“同源同构”是核心原则,确保产品服务一致性与全球化布局。方案旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力AI从实验室走向生产级应用。腾讯云通过硬件多元支持、软件加速优化及智能运维服务,降低企业技术门槛,已服务国内90%大模型厂商及千行百业。

  • 2025年国产主流分布式数据库产品

    随着数字化转型加速,国产分布式数据库在性能、安全性和自主可控方面取得显著进步,成为企业核心技术栈的重要组成部分。文章重点介绍了OceanBase、ArgoDB、TDSQL、PolarDB、GaussDB、GBase8a、GoldenDB和TiDB等主流产品,涵盖金融级高可用、HTAP混合负载、云原生架构等核心能力,广泛应用于金融、电信、政务等领域,展现出头部厂商激烈竞争的市场格局。

  • 基于华为云Token服务的稿定AI上线,一站式解决设计难题

    在视觉时代,AI正重塑设计交付方式。9月19日,华为全联接大会期间,中国商业设计品牌“稿定设计”推出基于华为云Token服务的AI设计平台“稿定AI”,实现从创意激发到成品交付的一站式服务。该平台具备灵感采集、创意激发、视觉精修等能力,通过分层内容生成和无限画布功能,让设计更高效可控。依托华为云算力支持,稿定AI大幅提升多模态大模型生成速度,文生图提速2

  • 腾讯云:扎根产业,出海破圈

    与产业共生共长,一直是腾讯云的愿景。 2025年9月16日,腾讯全球数字生态大会在深圳如期举行,其间腾讯云展现了多项新产品的进展和能力升级,并全面开放AI能力。 这意味着,腾讯云的产数融合又进了一步。 当下,腾讯云正在与千行百业深度融合,助力企业拥抱“智能化”与“全球化”,进而推动产业可持续高质量增长。 毋庸置疑,腾讯云“智向远大”。

  • Joyme完成从AWS到腾讯云迁移,成本减半、运维压力降八成

    在2025年腾讯全球数字生态大会上,出海企业Joyme宣布完成从AWS到腾讯云的全面迁移,成效显著:IT成本降低50%,运维压力下降80%,数据处理时效提升3倍,并实现分钟级容灾恢复。旗下社交直播平台LiveMe和拼图应用PhotoGrid已服务全球1800万创作者,累计分成超5亿美元。通过引入腾讯云WeData一体化Data+AI平台及EMR托管服务,Joyme优化了数据开发与治理流程,团队更专注于业务价值挖掘。此次合作展示了中国技术出海的新模式,腾讯云凭借强大产品能力助力企业应对全球化运营挑战。

  • 锐捷网络与亚信安全战略携手,共筑“一站式安全”云桌面新生态

    锐捷网络与亚信安全近日签署战略合作协议,共同推出“一站式安全”云桌面解决方案。双方将整合各自在云桌面和安全技术领域的优势,为企业用户提供更可靠的数字化办公环境。该合作聚焦终端安全、云安全等关键领域,通过产品深度适配实现无代理杀毒等创新功能,助力企业降低运营成本,提升安全防护能力。未来双方将持续深化合作,共同拓展云桌面安全市场新边界。

  • 新一代AI存储大幅提升训练效率,断点恢复速度提升

    AI训练频繁中断是行业难题。华为OceanStor A系列存储通过TB级集群带宽和高速读写能力,显著优化断点续训性能。AI大模型集群部署该方案后,恢复时间从15分钟缩短至1分钟,保障GPU/NPU算力资源充分利用。华为强调,高性能存储正成为以“存”强“算”的关键基础架构。

  • 青云租携手国资基金5亿入局,RWA通证化加速落地

    2025年8月27日,深圳爱高科创与深圳国英潜丰签署战略合作协议,国资金融基金5亿元投资青云租平台。资金将专项用于3C数码免押租赁业务拓展及RWA(实物资产通证化)项目。合作核心在于将青云租的免押租赁模式与区块链技术结合,实现租赁订单、应收账款等资产通证化,提升流动性和透明度。此举将推动资产证券化、跨境融资与港股市场拓展,加速中国数字租赁产业升级,展示行业硬核力量。

  • 腾讯云以“云+AI”助力金融数智化升级 已打造100+AI应用场景最佳实践

    腾讯云在2025全球数字生态大会上强调,人工智能已成为金融业提升效率与生产力的战略支柱。腾讯云已积累100多个AI应用场景的最佳实践,覆盖银行、保险、证券等领域,并发布TBDS多模态智能数据湖金融解决方案,助力金融机构实现数据与AI一体化存储计算。通过“云+AI”战略,腾讯云支持金融业应对行业转型、客户需求升级等挑战,推动数字化智能化发展。

今日大家都在搜的词: