首页 > 传媒 > 关键词  > 时序数据库最新资讯  > 正文

吃下 GuanceDB 狗粮后,观测云查询性能提升超 30 倍!

2023-05-08 13:39 · 稿源: 站长之家用户

本文作者:观测云资 深系统开发工程师 熊豹

2023 年 4 月 23 日,观测云正式发布自研时序数据库 GuanceDB,并在当天应用到了观测云所有 SaaS 节点的底座。此次升级性能提升的效果立竿见影,对比之前使用 InfluxDB 的环境资源占用大幅降低、查询性能显著提升,我们成功地吃上了自己的狗粮。

我们也深知 talk is cheap show me the benchmark 的道理,这里发布我们在近期完成的 GuanceDB 性能压测报告。

压测方案说明

本次测试的目标是对比 GuanceDB、InfluxDB 和某知名开源时序数据库(简称 xxDB)在相同的写入负载和查询条件下的性能表现及资源占用情况。

关于测试工具:

我们对比 tsbs、prometheus-benchmark 两种时序数据库的压测方案。

其中 prometheus-benchmark 构造了更偏真实环境的持续写入负载,指标数值的变化也更真实,所以我们主要参考 prometheus-benchmark 来构造本次测试。

原 prometheus-benchmark 方案中使用了 vmagent 来抓取和写入指标,但我们今天测试的 3 种数据库对 Prometheus 写入协议支持力度不一,没法一起比较。所以我们对 vmagent 进行了一些改造,让其支持了 InfluxDB 的行写入协议。

本次测试的最终方案如下:

1.部署的一个单机的 node-exporter ,其暴露宿主机的 1383 个真实指标

2.部署 Nginx 反代并缓存 node-exporter 结果 1s,降低频繁请求的压力

3.调整 agent 的抓取配置,模拟生成不同的 node-exporter 实例数以生成不同的写入负载

4.agent 以相同的请求大小、频率将数据同时以 influx 协议 http 接口写入三种时序数据库

软件版本:

1.GuanceDB: v1.0.0

2.InfluxDB: v1.8.10

3.xxDB

主机配置:

1.压测机:1 台阿里云 ecs.g7.16xlarge 云主机:64 core,128 GB RAM

2.存储集群:3 台阿里云 ecs.g7.4xlarge 云主机:16 core,64 GB RAM,200 GB PL1 类型 ESSD

部署方式:

因为 InfluxDB 的开源版本不支持集群模式,所以我们也将分两组进行测试。一组是 InfluxDB 与 GuanceDB、xxDB 的单机版本对比,另一组是 GuanceDB 与 xxDB 的集群模式进行对比,集群模式都使用 3 个存储节点。

参数优化:

GuanceDB 对大部分场景都做了自动调优,所以我们不用手动调整配置。

InfluxDB 默认对高基数场景做了一些保护,我们调整 max-series-per-database = 0 放开了限制,cache-max-memory-size 增大到了 10g,并且开启 tsi1 索引。

xxDB 我们也参考文档进行了针对性的调优。

至此完成所有配置,开始测试。

写入测试

●单机组

本组测试进行的测试轮次比较多,这里我们挑选某一轮展示详细监控截图。

在此轮测试中,我们虚拟了 344 个 node-exporter 实例,生成大约 50w 条活跃时间线,5s 抓取一次,时序点写入 QPS 10w。

GuanceDB 资源开销:CPU 占用率 2%,内存占用约 3 GB。

InfluxDB 资源开销:CPU 占用率 16%,内存占用约 7.4 GB。

xxDB 资源开销:CPU 占用率 61%,内存占用 9 GB。

汇总结果表格如下:

完成了限定性能的测试场景后,我们很好奇要多大的压力才能将各台数据库主机的资源打满,尤其对 GuanceDB,响应 10w 写入 QPS 仅仅花费了 2% 的 CPU 开销,它的性能上限在哪里?随即我们开始加大 QPS,当各台主机的 CPU,内存和磁盘若有一项被打满时,即被认为到达瓶颈。

实际测试结果都是主机的 CPU 先被打满,此时内存占用和磁盘写入带宽都还有余量,所以我们就以 CPU 利用率为瓶颈指标画出以下对比图:

在单机场景下,当 CPU 达到满载时,xxDB 的写入 QPS 约 15w,InfluxDB 约 90w,GuanceDB 约 270w。本轮 GuanceDB 获得第 一,写入性能是 InfluxDB 的 3 倍。也可以看到在 CPU 利用率超过 20% 后,性能不再呈线性增长,都有一定程度衰退。

●集群组

我们按照之前的方法继续测试 3 节点集群:

在集群场景下,仍然是 CPU 利用率先达到瓶颈。同样在 CPU 满载情况下,GuanceDB 此时的写入 QPS 约为 860w,xxDB 约为 45w。

对比之前 GuanceDB 和 xxDB 的单机写入性能测试,理想情况下 N 个节点的集群版的写入性能应该是单机版的 N 倍,呈线性增长,实测 3 节点集群符合性能预期。

查询测试

查询测试将混合单机 InfluxDB、集群版 GuanceDB、集群版 xxDB 一起进行。集群一般可以将数据和查询分摊并可以在节点之间并行查询,理论上这个测试方式对 InfluxDB 不太公平,但条件受限,暂且这么设计。

我们虚拟 688 个 node-exporter 实例,生成大约 100w 个活跃时间线,5s 抓取一次,时序点写入 QPS 20w。在持续写入 24 小时后,我们再测试一些常见语句的查询性能和对比存储空间占用。

GuanceDB 同时支持 DQL 和 PromQL 两种查询语法。DQL 是观测云自研的多模数据查询语言,同时支持指标、日志、对象等多种类型负载数据的查询和分析,语法表达非常简洁。语法设计上跟 SQL 接近,但更加适应时序分析场景,学习曲线平滑。

这里我们一共对比了四种查询语法在相同语义的 1h、8h、24h 不同时间范围下的响应时间:

查询 1 响应时间:

注:图示中 0ms 表示响应时间不到 1ms。

查询 2 响应时间:

查询 3 响应时间:

注:图示中 -1ms 表示请求响应时间超过了 60s 不计数。

空间占用对比

在上述的查询测试构造的写入压力(活跃时间线 100w,时序点写入 QPS 20w)下,运行 24 小时后,我们对比存储空间占用。

总结

经过数轮的写入和查询性能测试,相信各位对 GuanceDB 的综合性能表现已经有了比较清晰的认识了。GuanceDB 对比 InfluxDB 写入性能提升 3 倍,存储空间占用减少 68%,查询性能提升 30 倍以上。GuanceDB 相比 xxDB 提升则更明显,背后的原因是 xxDB 虽然明面上是支持了 Schemaless 数据的写入,但是对 Schemaless 的场景明显优化不足,所以表现欠佳。

GuanceDB 的优异性能来自于我们构建的有效的火山模型查询引擎、SIMD 指令加速、对 Schemaless 数据的最 优先支持等,也因为我们站在了 VictoriaMetrics 的肩膀上。非常感谢 VictoriaMetrics 开源社区对我们的支持,我们将持续贡献回报社区,共同促进可观测领域技术的发展与进步。

我们在 5 月中下旬也将发布 GuanceDB 的单机版本,欢迎大家到时关注和测试。如有同学对 GuanceDB 感兴趣,或有任何疑问,可以随时站内和我联络,或者在观测云社群里沟通。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 金仓数据库守护中国铁路安全运行

    中国铁路集团开展"守底线、补缺陷、除隐患、防风险"安全专项行动,建设多功能线路巡防平台,采用金仓数据库技术实现云边端协同工作。该平台具有实时监控、智能分析等功能,2025年4月将在全国18个铁路局全面上线运行。系统采用读写分离高可用集群架构,支持自动容灾切换和负载均衡,确保铁路运输安全畅通。平台通过自主研发的加密技术保障数据安全,性能损�

  • 金仓数据库支撑海南自贸港“单一窗口”稳定运行

    国家发改委宣布海南自贸港将于2025年12月18日启动全岛封关运作。为提升通关效率,海南国际贸易"单一窗口"(口岸监管服务信息系统)项目正加快建设,由金仓数据库(KES)提供技术支持。该系统整合政府部门与联检单位需求,支持"一线放开、二线管住"监管模式,具备高兼容性、强性能、全方位安全防护等特点,已平稳运行8个月。项目采用国产化环境建设,通过多节点高可用集群架构,实现7×24小时不间断服务,满足秒级通关等严苛要求。未来将持续赋能智慧海南建设,为打造国际化自贸港提供数字化支撑。

  • 数据库就要选华为云!

    文章讲述了作者10年前创业失败的经历,反思当时过度投入高端服务器和技术架构,却忽视了业务实际需求。如今随着云计算、大数据等技术发展,数据库架构设计更强调弹性、可靠性和智能化。游戏行业作为典型高并发场景,对数据库提出实时响应、高可用等严苛要求。华为云TaurusDB作为新一代云原生数据库,具备高性能(QPS达百万级)、弹性扩展(1写15读节点)、高可靠性(跨区部署、RPO为0)等优势,完美适配游戏行业需求。其核心技术包括计算存储分离、并行执行和NDP近数据处理,解决了传统MySQL架构的复制延迟等问题。文章建议企业选择与业务协同成长的数据库平台,而非从零搭建架构。

  • 8TB登场 三星 9100 PRO PCIe 5.0 固态硬盘,性能规格上新

    三星电子于2025年8月20日推出9100PRO系列8TB固态硬盘,包括标准版和散热片版。新品采用PCIe 5.0接口,顺序读写速度分别高达14,800MB/s和13,400MB/s,相比前代990PRO性能提升99%。支持多设备兼容,包括笔记本电脑、游戏主机等,适用于游戏、内容创作等高性能场景。8TB版本将于9月2日发售,建议零售价分别为999.99美元和1019.99美元。

  • 王宁掏出迷你版LABUBU

    “这周就要发布Mini版LABUBU,以前可能大家是挂在包上,可能从下周开始,大家甚至可以挂在手机上,它的使用场景会更多,相信它会是一个超级受欢迎的爆款。” 8月20日,在泡泡玛特2025年中期业绩发布会上,泡泡玛特董事长兼CEO王宁化身“带货博主”,从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。 这款即将登场的 Mini 版 LABUBU 仅有掌心大小,延续了LABUBU标志性的搪胶毛�

  • 智检未来 触手可及——CASIVIBOT工业质检机器人震撼发布

    8月19日,中科慧远发布首款工业具身质检机器人CASIVIBOT,以“具身智能”为核心,融合人类质检经验与AI技术,实现灵活操作与高效检测。该机器人采用“手-眼-脑”协同架构,支持多行业复杂场景应用,具备快速部署和持续进化能力,旨在推动工业质检智能化升级,提升检测效率与灵活性。

  • 泡泡玛特王宁:本周将发布迷你版LABUBU

    昨日,泡泡玛特公布了其2025年中期业绩报告,数据显示,报告期内公司收益高达138.76亿元,与去年同期相比增长了204.4%,业绩表现十分亮眼。 在今日举行的泡泡玛特2025年中期业绩会上,创始人兼CEO王宁对公司未来发展充满信心。他透露,原本公司希望今年营收能够达到200亿,但就目前情况来看,实现300亿的营收目标也颇为轻松。

  • 印度女子误将Labubu当神明供奉 网友调侃:Labubu正式封神了!

    日,印度一名女子误把中国人气玩偶Labubu当神明供奉,还献上供品,引发网友热议。 据悉,这段视频最初由网友上传至TikTok与X,附文写道:一个印度女孩告诉妈妈,Labubu是中国神明,结果妈妈立刻开始供奉。” 视频中可以看到,女子拿起Labubu玩偶,对着神坛进行传统祈祷仪式,还向玩偶献上水果供品。 有的网友觉得十分搞笑,调侃道:Labubu 正式封神了!”

  • 三星全球首发Micro RGB,为高端显示技术树立标杆

    三星电子发布全球首款Micro RGB显示技术,采用小于100微米的微型RGB LED阵列,实现精准独立控光。该技术突破性地应用于115英寸超大屏幕,带来100% BT.2020色域覆盖和VDE认证的精准色彩表现。搭载AI引擎可实时优化画质,配备防眩光技术和超薄金属机身。产品集成Vision AI系统,支持生成式AI语音助手Bixby,并配备三星Knox安全方案,提供7年Tizen系统更新支持。这款产品重新定义了高端显示标准,即将登陆中国市场。

  • 一夜变天!GitHub CEO辞职:微软全面接管

    2018年的时候,微软以75亿美元收购GitHub,当时承诺其将保持独立运营。 GitHub CEO Thomas Dohmke宣布即将离职,Thomas Dohmke表示:在担任CEO近四年后,我将厉害GitHub,再次成为一名初创公司的创始人。”

今日大家都在搜的词: