首页 > 传媒 > 关键词  > 时序数据库最新资讯  > 正文

吃下 GuanceDB 狗粮后,观测云查询性能提升超 30 倍!

2023-05-08 13:39 · 稿源: 站长之家用户

本文作者:观测云资 深系统开发工程师 熊豹

2023 年 4 月 23 日,观测云正式发布自研时序数据库 GuanceDB,并在当天应用到了观测云所有 SaaS 节点的底座。此次升级性能提升的效果立竿见影,对比之前使用 InfluxDB 的环境资源占用大幅降低、查询性能显著提升,我们成功地吃上了自己的狗粮。

我们也深知 talk is cheap show me the benchmark 的道理,这里发布我们在近期完成的 GuanceDB 性能压测报告。

压测方案说明

本次测试的目标是对比 GuanceDB、InfluxDB 和某知名开源时序数据库(简称 xxDB)在相同的写入负载和查询条件下的性能表现及资源占用情况。

关于测试工具:

我们对比 tsbs、prometheus-benchmark 两种时序数据库的压测方案。

其中 prometheus-benchmark 构造了更偏真实环境的持续写入负载,指标数值的变化也更真实,所以我们主要参考 prometheus-benchmark 来构造本次测试。

原 prometheus-benchmark 方案中使用了 vmagent 来抓取和写入指标,但我们今天测试的 3 种数据库对 Prometheus 写入协议支持力度不一,没法一起比较。所以我们对 vmagent 进行了一些改造,让其支持了 InfluxDB 的行写入协议。

本次测试的最终方案如下:

1.部署的一个单机的 node-exporter ,其暴露宿主机的 1383 个真实指标

2.部署 Nginx 反代并缓存 node-exporter 结果 1s,降低频繁请求的压力

3.调整 agent 的抓取配置,模拟生成不同的 node-exporter 实例数以生成不同的写入负载

4.agent 以相同的请求大小、频率将数据同时以 influx 协议 http 接口写入三种时序数据库

软件版本:

1.GuanceDB: v1.0.0

2.InfluxDB: v1.8.10

3.xxDB

主机配置:

1.压测机:1 台阿里云 ecs.g7.16xlarge 云主机:64 core,128 GB RAM

2.存储集群:3 台阿里云 ecs.g7.4xlarge 云主机:16 core,64 GB RAM,200 GB PL1 类型 ESSD

部署方式:

因为 InfluxDB 的开源版本不支持集群模式,所以我们也将分两组进行测试。一组是 InfluxDB 与 GuanceDB、xxDB 的单机版本对比,另一组是 GuanceDB 与 xxDB 的集群模式进行对比,集群模式都使用 3 个存储节点。

参数优化:

GuanceDB 对大部分场景都做了自动调优,所以我们不用手动调整配置。

InfluxDB 默认对高基数场景做了一些保护,我们调整 max-series-per-database = 0 放开了限制,cache-max-memory-size 增大到了 10g,并且开启 tsi1 索引。

xxDB 我们也参考文档进行了针对性的调优。

至此完成所有配置,开始测试。

写入测试

●单机组

本组测试进行的测试轮次比较多,这里我们挑选某一轮展示详细监控截图。

在此轮测试中,我们虚拟了 344 个 node-exporter 实例,生成大约 50w 条活跃时间线,5s 抓取一次,时序点写入 QPS 10w。

GuanceDB 资源开销:CPU 占用率 2%,内存占用约 3 GB。

InfluxDB 资源开销:CPU 占用率 16%,内存占用约 7.4 GB。

xxDB 资源开销:CPU 占用率 61%,内存占用 9 GB。

汇总结果表格如下:

完成了限定性能的测试场景后,我们很好奇要多大的压力才能将各台数据库主机的资源打满,尤其对 GuanceDB,响应 10w 写入 QPS 仅仅花费了 2% 的 CPU 开销,它的性能上限在哪里?随即我们开始加大 QPS,当各台主机的 CPU,内存和磁盘若有一项被打满时,即被认为到达瓶颈。

实际测试结果都是主机的 CPU 先被打满,此时内存占用和磁盘写入带宽都还有余量,所以我们就以 CPU 利用率为瓶颈指标画出以下对比图:

在单机场景下,当 CPU 达到满载时,xxDB 的写入 QPS 约 15w,InfluxDB 约 90w,GuanceDB 约 270w。本轮 GuanceDB 获得第 一,写入性能是 InfluxDB 的 3 倍。也可以看到在 CPU 利用率超过 20% 后,性能不再呈线性增长,都有一定程度衰退。

●集群组

我们按照之前的方法继续测试 3 节点集群:

在集群场景下,仍然是 CPU 利用率先达到瓶颈。同样在 CPU 满载情况下,GuanceDB 此时的写入 QPS 约为 860w,xxDB 约为 45w。

对比之前 GuanceDB 和 xxDB 的单机写入性能测试,理想情况下 N 个节点的集群版的写入性能应该是单机版的 N 倍,呈线性增长,实测 3 节点集群符合性能预期。

查询测试

查询测试将混合单机 InfluxDB、集群版 GuanceDB、集群版 xxDB 一起进行。集群一般可以将数据和查询分摊并可以在节点之间并行查询,理论上这个测试方式对 InfluxDB 不太公平,但条件受限,暂且这么设计。

我们虚拟 688 个 node-exporter 实例,生成大约 100w 个活跃时间线,5s 抓取一次,时序点写入 QPS 20w。在持续写入 24 小时后,我们再测试一些常见语句的查询性能和对比存储空间占用。

GuanceDB 同时支持 DQL 和 PromQL 两种查询语法。DQL 是观测云自研的多模数据查询语言,同时支持指标、日志、对象等多种类型负载数据的查询和分析,语法表达非常简洁。语法设计上跟 SQL 接近,但更加适应时序分析场景,学习曲线平滑。

这里我们一共对比了四种查询语法在相同语义的 1h、8h、24h 不同时间范围下的响应时间:

查询 1 响应时间:

注:图示中 0ms 表示响应时间不到 1ms。

查询 2 响应时间:

查询 3 响应时间:

注:图示中 -1ms 表示请求响应时间超过了 60s 不计数。

空间占用对比

在上述的查询测试构造的写入压力(活跃时间线 100w,时序点写入 QPS 20w)下,运行 24 小时后,我们对比存储空间占用。

总结

经过数轮的写入和查询性能测试,相信各位对 GuanceDB 的综合性能表现已经有了比较清晰的认识了。GuanceDB 对比 InfluxDB 写入性能提升 3 倍,存储空间占用减少 68%,查询性能提升 30 倍以上。GuanceDB 相比 xxDB 提升则更明显,背后的原因是 xxDB 虽然明面上是支持了 Schemaless 数据的写入,但是对 Schemaless 的场景明显优化不足,所以表现欠佳。

GuanceDB 的优异性能来自于我们构建的有效的火山模型查询引擎、SIMD 指令加速、对 Schemaless 数据的最 优先支持等,也因为我们站在了 VictoriaMetrics 的肩膀上。非常感谢 VictoriaMetrics 开源社区对我们的支持,我们将持续贡献回报社区,共同促进可观测领域技术的发展与进步。

我们在 5 月中下旬也将发布 GuanceDB 的单机版本,欢迎大家到时关注和测试。如有同学对 GuanceDB 感兴趣,或有任何疑问,可以随时站内和我联络,或者在观测云社群里沟通。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 从“烟囱式监控”到观测云平台:2025 亚马逊云科技峰会专访

    在2025年亚马逊云科技中国峰会上,观测云技术总监黄小龙分享了《下一代智能可观测性平台技术实践》主题演讲。他提出要构建"智能一体化可观测性平台",解决当前行业"烟囱式"监控体系带来的数据割裂和协同成本问题。平台采用统一数据基础、查询语言和分析入口,并基于S3架构打造GuanceDB3.0数据库,实现存储与计算分离。在AI能力方面,推出智能体Obsy AI,提供智能助手、智能分析和智能告警功能。此外还扩展了SIEM安全事件分析能力,构建专用引擎Arbiter。观测云深度整合亚马逊云科技生态,存储层托管于Amazon S3,计算资源调度基于EKS,智能体由Amazon Bedrock提供大模型能力,并通过Marketplace全球提供服务。

  • 估值暴涨30倍,蔡崇信又赚了

    蔡崇信夫妇身影浮现。 据美国《The Athletic》报道,美国女子职业篮球联赛(WNBA)纽约自由人队以4.5亿美元(超32亿人民币)估值出售股权,创下了女子职业体育俱乐部的最高估值纪录。 该球队背后,是一对外界熟悉的夫妇——蔡崇信(Joe Tsai)和妻子吴明华(Clara Wu Tsai)。他们曾在2019年以超过1000万美元买下自由人队,由吴明华进行管理决策,如今估值大幅翻升。 将体育爱好运�

  • 酒店如何用AI吃下演唱会“流量红利”?

    才推出不需要懂代码的AI coding工具“NoCode”,让普通人可以“一句话,呈所想”地开发网站页面或实用工具,然后又拿出业内首个面向酒店商家的AI工具,让酒店业可以享受AI演进带来的技术红利。在AI这件事上,美团的脚步越拉越快。 6月5日,美团召开住宿生态伙伴大会,发布“美团既白”垂类AI产品。这个颇有诗意的名字源于《赤壁赋》中的名句,而这个工具价值在于,借AI

  • 腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座

    随着生成式AI技术爆发式增长,AI大模型开始渗透至手机领域。荣耀基于腾讯云TencentOS Server AI的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,在内部场景应用中实现稳定性、可靠性和推理性能的大幅提升。测试显示,使用TACO-LLM后,首Token延迟最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。TACO-LLM通过投机采样技术实现大模型"并行"解码,从根本上解决计算密度问题,大幅提升解码效率。荣耀表示该方案打造了高性能AI底座,提供高吞吐低延迟的优化方案,能无缝整合现有大模型部署方案。腾讯云TACO-LLM针对企业级AI模型私有化部署挑战,专门优化了大语言模型内核运行效率。

  • 疯产姐妹近30日掉粉超19万 邵雨轩谈疯产姐妹解散原因

    近日,知名短视频组合“疯产姐妹”成员邵雨轩在接受采访时,首次公开了该组合解散的真实原因。 她表示,随着组合知名度的急剧提升,突如其来的巨大关注如同沉重的行囊,给她们带来了前所未有的创作压力。在高强度的内容产出要求下,两人逐渐失去了最初的创作快乐,为了持续满足粉丝的期待,她们陷入了精神内耗,最终决定暂停合作,以调整身心状态。

  • 李想首次透露理想轿车项目:年度营收超3000亿后才去做

    日前,理想汽车管理层在一季度财报电话会上表示,理想焕新版车型上新后,每周销量均超过一万台,5月截至目前在20万元以上市场市占率14.7%,理想有信心焕新版车型很快会回到月销量五万台水平。 针对分析师提出理想汽车在什么阶段会考虑进军轿车市场”的问题。 李想回应称,我们认为,增程SUV、纯电SUV以及理想MEGA全部开启交付后,可以支持理想汽车实现一年3000亿人民

  • 微星MAG 275QPF X30黑刃显示器:618千元档电竞屏,300Hz+2K狂飙性能!

    618购物节前夕,微星推出全新电竞显示器MAG 275QPF X30黑刃,主打高性价比电竞装备。该产品配备27英寸2K IPS面板,支持300Hz超高刷新率和0.5ms疾速响应,通过HDR400认证,搭载智能视觉增强技术,可优化暗部场景和色彩表现。接口方面配备双HDMI 2.1和DisplayPort 1.4a,支持PS5/Xbox等主机4K/120Hz输入。原价1299元,618期间叠加国家补贴和京东PLUS会员券后到手价仅909元,堪称千元档电竞显示器性价比之选。购买晒单还可参与微星小红书活动赢取额外福利。

  • LABUBU一代出租一天价格30元 网友:成新晋打工娃

    近期,潮玩Labubu凭借独特魅力爆火走红,不少敏锐的用户从中发现了新的商业契机,纷纷在闲鱼平台出租Labubu系列公仔。 在闲鱼上以“Labubu出租”“拉布布出租”为关键词进行搜索,能发现众多卖家正在提供实体公仔的出租服务。这些公仔的宣传用途主要集中在登记结婚、领证、婚宴、场景布置以及道具拍摄等场景,满足不同用户在特殊时刻的需求。 从价格方面来看,Labubu�

  • 名创优品Q1财报:海外门店超3200家,海外营收同比增长30%

    名创优品集团2025年第一季度财报显示业绩稳步增长,总营收达44.3亿元,同比增长19%,毛利率44.2%创同期新高。公司推进"开好店、开大店"战略,旗舰店型MINISO LAND已开业8家,150家正在规划中。海外业务收入15.9亿元,同比增长30%,北美门店突破300家。IP战略成效显著,与迪士尼等合作推出的联名产品热销,自有IP"吉福特家族"销售额破亿。旗下潮玩品牌TOP TOY营收增长59%至3.4亿元,全球旗舰店落地上海。公司持续优化供应链管理,通过精细化运营提升盈利能力,为股东创造稳定回报。

  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI解决方案,推动大模型技术向教育领域加速渗透。网易有道表示,希望该模型能吸引更多开发者共同探索教育领域应用价值。