首页 > 传媒 > 关键词  > 监控宝最新资讯  > 正文

应用性能分析神器“透视宝”亮剑之监控宝API监控优化

2016-08-30 11:32 · 稿源: 站长之家用户

企业IT部门在进行互联网/移动应用功能优化过程中最大的痛点在于,明明知道应用存在问题,却难于准确定位具体问题点并快速制定有效的解决方案,此时企业最需要有一套全栈应用性能监控、管理工具。透视宝是云智慧推出的新一代面向业务的端到端应用性能管理(APM)平台,针对移动和Web应用,提供全面的性能监控、分析与管理解决方案,本文将重点描述透视宝在优化云智慧旗下网络监控产品——监控宝API监控过程中起到的关键作用。

一、监控宝API监控遇到的问题

监控宝API监控用于对企业内部自有API及第三方数据接口的正确性、可用性与耗时分析进行即时监控、告警,为接口服务提供有效的质量保障。由于越来越多的云智慧客户因为业务的需要,大量使用API实现事务, API监控的需求呈指数级增长,造成了监控宝相关模块线上告警处理任务队列的堆积问题,具体表现为:告警处理信息消费队列严重堆积,高峰时达到几十万条告警任务等待被消费,造成了告警延迟。

API监控研发人员首先判断是程序代码的Bug,于是将可能造成信息消费队列瓶颈的相关代码梳理了一遍,初步判断可能是以下几点原因造成的:

1.告警消费线程只有20个,存在消费能力不足的问题;

2.在消费线程中有数据库访问操作,影响了消耗性能;

3.程序日志文件中出现大量无法获得数据库连接、数据类型转换错误等日志信息,影响告警逻辑的处理效率;

二、为什么选择“透视宝”

由于缺少足够证据证明上述判断,所以透视宝团队虽然在代码层面进行了针对性的优化,并且模拟了大数据并发的处理场景,但仍然没有真正解决线上产品的问题。

为了快速排查问题,平台开发组提出在线下建立与线上“一比一”的应用环境(包括:操作系统,数据库的配置、结构、数据、应用程序),用透视宝实现该环境的监控和分析,从操作系统资源使用、数据请求访问情况、数据库运行状况、应用系统错误记录等多个方面入手。同时在线上环境也安装一套透视宝,以便于对于同类监控数据的对比、分析、排查问题。

三、“透视宝”解决问题的过程分析

(一)首先,看一下线上透视宝监控分析内容:

1、运行环境总体情况

从这个页面可以看到,API监控整体运行情况非常慢,错误非常多,数据库请求时间比较长。

2、数据请求访问情况

从这个页面可以看到不同监测点请求调度器的请求数量和平均响应时间,根据请求、响应时间、请求数量进行排序,可以看到最大平均响应时间和最小平均响应时间。API监控研发人员在看到这个数据的时候被震惊了,平均响应时间有几秒钟,肯定是在数据请求的时候出现了问题。于是仔细查看这部分代码,发现有大量的数据库读、更新、写的操作,并且非常频繁,怀疑是数据库范文遇到了瓶颈。

3、数据库服务运行情况

接下来透视宝提供的数据库监控分析服务,明确地告诉我们的确是这个方面的问题。从这个页面可以很直观的看到不同数据库表上的不同操作的响应时间,在2000ms以上的响应时间占据了大部分,说明数据库读写有严重问题。查看上面提示的库表结构,发现很多库表一个索引都没有,而且查询非常频繁,不仅后端Java要查,前端PHP也要查。

4、线上错误总体分析

上面的图表展现的是应用程序错误信息的总体情况,下面是错误信息发生的外部事务,返回的状态码,错误的发生次数,以及第一次和最后一次的发生时间,能够清楚地看到不同类型错误的发生频率。

(二)问题解决之后的对比:

1、数据访问情况

这个图可以看到,从8月10日下午2点开始,监测点请求调度器的平均最大时间由5秒钟变成了39毫秒,由于响应时间的降低,请求数也从不到20万提升到25万以上。监控宝研发人员在看到这个数据的时候,第一反应是认为程序出现问题了,后来证实完全没有问题,透视宝给了我们一个非常直观、便捷的反馈信息。

2、数据库服务运行状况对比:

数据库性能,同样经历了从波涛汹涌到风平浪静的过程。这要归功于透视宝提供的数据库表以及操作问题,研发人员进行了针对性的解决,才有了如此高的数据库访问性能的提升。

3、应用程序错误总体情况对比:

根据透视宝的分析结果,对出错频繁的操作进行针对性优化,错误数和异常数大大降低。

四、总结:“透视宝”的功能强大、简洁易用

在解决API监控问题的过程中,开发环境、QA环境、“一比一”的Beta环境均无法重现堆积问题,而生产环境对于开发团队来说是黑盒,没有访问权限。因为历史原因,应用有大量的日志,但日志加的很乱,几乎获取不到多少有效信息,即使后面在代码中加日志,也不知道从何加起,工作量也很大。

透视宝很轻松的解决了上述问题,准确获得生产环境中实际被调度的任务量和返回的需要处理的量,虽然QA模拟的任务数比生产还多,但需要处理的数据却比生产少很多,同时还知道了处理一次数据平均需要5秒。通过透视宝的数据库功能发现请求中有很多SQL访问特别慢,针对问题添加索引、优化SQL语句、提高线程数、优化代码,使响应时间提高了近百倍,成功解决了堆积和丢任务的问题。

监控宝API监控的开发团队成功利用“透视宝”快速定了API监控优化过程中遇到的问题(包括应用程序和应用环境),并提供了准确、有效的分析数据,在本次API监控优化过程中扮演了关键角色。而解决此次问题主要使用了“透视宝”APM和主机性能监控模块的部分功能,透视宝还提供从移动端、Web端深入到代码层的全面性能监控,帮助您实时发现与定位应用在线上环境运行的各种故障与性能瓶颈。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • GEO排名查询工具:AI时代下的品牌可见度监控指南

    随着ChatGPT等生成式AI平台爆发,用户获取信息方式发生根本转变,传统搜索引擎优化(SEO)正被生成引擎优化(GEO)取代。文章指出,品牌在Google排名第一却可能在AI平台无人知晓,因此AI搜索排名成为2024年B2B营销新焦点。GEO需关注三大核心指标:品牌在AI回答中的提及频次、竞品对比排名、提及语境质量。有效的GEO工具应具备多平台覆盖、真实场景模拟、多维度分析能力,并通过四步实施:建立基准数据、识别优化机会、制定优化方案、持续监控迭代。GEO并非替代SEO,而是其延伸,两者需协同推进。

  • 32路监控+4K影库!海康R1全能NAS:你的私人数据管家

    海康S1全能NAS以高性能硬件配置重新定义NAS标准:搭载英特尔N100处理器,性能较前代提升40%;支持32路监控存储与4K影库构建;具备双M.2插槽和双2.5G网口,提供高速存储与5Gbps聚合带宽。集成智能AI管理,支持人脸识别、事件标记等智慧相册功能,配合96TB超大容量与触控屏设计,兼顾专业监控与家庭娱乐需求,实现性能与颜值的全面突破。

  • 影目INMO GO3新品发布,携手蚂蚁、腾讯应用宝、智谱等行业巨头打造AI+AR生态

    10月16日,影目科技发布新一代AI智能眼镜INMO GO3,主打“未来科技美学提案”,推动行业颜值与功能革新。产品采用多款差异化镜框设计,搭载8mm超细镜腿,告别传统笨重外观;配备双芯片架构与可拆卸电池,实现全天候佩戴。功能上支持双向实时翻译、AI语音交互及AR社交名片等创新应用,覆盖260余种语言。同时携手腾讯、蚂蚁集团等行业巨头共建开放生态,布局2000余家线下门店,以“产品+生态+渠道”三维优势重塑智能眼镜体验,引领AI+AR时代生活方式变革。

  • 不断进步的监控宝 随时监控网站的运行状态

    监控宝的用户包括网站管理员、IT项目负责人、技术主管、品质监测人员、运维人员、开发人员、IDC管理员,以及个人站长。监控宝可时时刻刻为你监控 网站的运行状态,并为你提供可用率统计,响应时间统计等技术参数,动态形成不同时间段的统计报表。当你的网站出错不能访问

  • 监控宝护航千万患者在线“寻医问药”

    监控宝是云智慧推出的IT性能监控(IT Performance Monitoring)SaaS产品服务,包含网站监控、基础设施监控(硬件及网络)、应用服务性能监控、平台API健康检查及监控、业务平台性能测试及诊断等,采用云计算、大数据开放架构为客户提供业务连续性的全生命周期管理。

  • 携手抗“疫”,云智慧监控宝为企业提供免费IT运维监控服务

    一场突如其来的新冠肺炎疫情不但冲击着亿万国人的身体健康,还给企业的IT系统带来了巨大的压力。“在线办公”、“在线教学”、“在线会议”成为热点,“疫情经济”倒逼传统企业线上自救,例如某餐饮巨头就通过私域流量开展订餐配送,短短几天在线业务就达到总体业务的80%。然而,极端复杂的网络接入、链路质量、机房环境,随时可能导致网站、API和Web服务缓慢、异常和故障,用户访问体验不佳,给企业带来业务损失。 云智慧监控宝?

  • 如何用监控宝自定义监控搞定个性化应用系统运维

    您想看到Memcached服务器、Java虚拟机内存使用率的变化情况吗?您想监控Discuz论坛在线人数的实时变化趋势吗?你想对自己开发的业务系统,随心所欲的定制监控项目吗?用开源第三方监控产品部署的监控任务指标太多、界面太复杂,能在监控宝进行关键任务监控吗?这些事情监控宝自定义监控帮你全搞定!

  • 云计算时代的网站监控神器——监控宝6

    云计算技术的广泛应用,让越来越多的企业把线上业务部署或迁移到云端。然而传统IT监控工具如Zabbix等,无法对云服务、IDC、CDN和外部访问链路做到统一有效的全局监控,当用户体验出现问题时就很难作出及时的响应。 云智慧全新推出的监控宝6,主动追踪基于云端架构的网站真实用户访问链路,深入监测IDC、云主机、CDN、运营商等各个环节的性能指标,从而实现全网用户体验的实时告警、快速定位和根因分析,是云计算时代的网站监控神?

  • 监控宝发布移动应用监控服务 引领移动APM

    ——国内领先的应用性能管理运营商,云智慧(北京)科技有限公司近日宣布,推出“移动应用监控服务”。这项全新的企业级监控服务解决方案,基于应用服务接口监控业务过程,捕捉应用或服务的终端用户体验,跟踪整个应用交互的数据流,发现业务端口可用率和正确性以及业务性能数据分析,在国内尚属首创。

  • 利用SNMP和监控宝实现linux vps 服务器性能监控

    再我们管理服务器时候windosw系统较为直观,cpu使用多少,内存用了多少带宽等等 只要在远程桌面里 的任务管理器一目了然。但是在linux环境下就没那么轻松了,尤其服务器或者vps上运行的是大型网站,如果不能及时发现服务器性能消耗,很有可能导致网站在访问高峰期,出现卡死都不知道什么情况。

今日大家都在搜的词: