监控系统泛滥：CTO 面临的隐形成本危机

2024-04-15 11:08 · 稿源：站长之家用户

在信息技术飞速发展的今天，构建和维护现代化的数字系统变得日益复杂和关键;在这样的背景下，监控系统的作用变得尤为突出。正如业界广泛流传的一句经验之谈“无监控，不运维”所揭示的道理一样，对于任何具有一定复杂性的数字系统来说，如果没有一个全面且精细的监控体系作为支撑，系统的维护和管理工作将变得极为困难，甚至不能有效地进行。

缺乏有效的监控机制，系统一旦出现任何异常或故障，工程师们将难以迅速地对问题进行定性分析和准确定位。这不仅会拖延问题的解决速度，增加系统的停机时间，还可能导致一系列的连锁反应，影响到整个业务的连续性和稳定性。在这样的情况下，工程师们的工作就像是在没有视觉指引的情况下进行精密手术，不仅效率低下，而且风险极高。因此，为了确保数字系统的有效运行和可靠性，建立一个全方位、多层次、实时性的监控系统是至关重要的。这样的监控系统能够提供深入的洞察力，使得工程师们能够及时发现并解决潜在的问题，优化系统性能，并保障业务的顺畅运行。简而言之，监控系统不仅是运维工作的基础，更是确保整个数字生态系统健康稳定的关键所在。

然而，构建一个完整的监控体系是一项非常复杂的任务，一个完整的业务需要的监控系统可能包括了云和基础设施监控、容器平台监控、中间件监控、日志分析监控、应用性能监控、终端应用监控、网站应用监控及用户行为分析监控等等。传统的监控建设方式通常是基于业务需求来定制和部署监控解决方案。在这种模式下，每个业务部门或团队往往会根据自身特定的需求来选择和配置监控平台。这意味着随着组织业务线的扩展和多样化，将会陆续涌现出众多独立的监控系统，每一个系统都需针对特定业务或应用进行专门的优化与调整。同时，在采用多云环境的情况下，组织往往会依赖于多个云服务提供商的资源和服务来搭建及运行其业务应用。这种做法虽然为组织带来了灵活性、可扩展性以及成本效益等显著优势，但也对监控系统提出了新的挑战，进一步加剧了监控系统过度增殖的问题。

因此，我们可以观察到一个现象:即使是规模较小的公司，也可能至少部署和维护着三到五套不同的监控系统，以满足其多样化的业务需求和技术支持。不难想象，对于大型企业来说，这一数字可能会更加惊人，他们可能同时运行着数十套监控平台。

「监控系统的过度增殖，不仅会消耗宝贵的资源，更会加剧管理的复杂性，成为CTO们无法回避的成本和效率难题。」

监控系统的"增生"带来了哪些问题?

从单体角度来看，每套监控系统对硬件资源的占用可能并不显著，但当这些系统数量累积起来时，总体的硬件成本就会变得不容忽视。此外，不同监控系统之间的技术异构性也导致了资源的分散和利用率的下降。企业需要为每一套系统配置独立的硬件资源，而这些资源在实际运行中可能并未得到充分利用，从而导致了资源浪费。

同时，随着监控系统数量的增加，企业在硬件维护和管理上的工作量也随之增加，这不仅增加了运维成本，也可能影响到监控系统的稳定性和可靠性。对于那些采用商业监控产品的企业来说，这个问题尤为突出，因为商业产品往往伴随着昂贵的授权费用、升级服务费以及技术支持费等额外开销。随着监控系统的增多，商业成本将成倍增加，企业财务状况也要面对较大压力。

运维成本的增加不仅体现在硬件资源的投入上，更体现在软件层面的技术维护和升级上。首先，因为技术选择的多样性，每个监控系统可能基于不同的技术栈和架构设计。这就要求运维团队必须精通多种技术，以便有效地维护和管理这些系统。这不仅增加了团队的学习成本，还提高了对专业技能的依赖。同时，技术栈之间的差异也可能导致解决方案的不一致，增加了故障排查和解决问题的复杂性。

其次，由于不同监控系统可能是在不同时间引入的，因此即使是相同技术方案的监控系统，也可能存在多个版本。例如，企业可能同时运行着多个版本的ELK（Elasticsearch、Logstash、Kibana）堆栈，每个版本都可能需要不同的维护策略和升级路径。这种情况下，保持各个版本的兼容性和安全性就成为了一项挑战，同时也增加了维护系统的工作量和潜在的风险。此外，不同版本的监控系统还可能导致数据格式和接口的不一致，这也会造成数据整合和分析的障碍，运维团队需要投入额外的时间和精力来处理这些差异，以确保监控数据的准确性和可用性。

分散的监控系统是工程师低效的“罪魁祸首”

传统的监控系统往往是从运维的角度出发，注重保障系统的稳定性和可用性。这类监控系统侧重于监测硬件性能、网络状况和服务响应时间等关键指标，并利用告警机制向运维团队报告潜在或已经发生的问题。然而，这种以运维为中心的监控建设方式往往忽视了研发团队在应用开发和维护过程中的特殊需求。随着应用的复杂性增加，研发团队可能需要引入如APM（应用性能管理）等工具来更好地进行故障定位和性能优化。这类工具能提供更为细致的应用级监控数据，帮助研发团队深入理解应用的运行状况。

而当运维和研发团队使用不同的监控工具和数据维度时，信息孤岛和协作障碍便成了问题。这种分割的监控系统可能导致巨大的合作成本，工程师可能需要花费大量时间在多个孤立、数据格式不一致的系统中寻找支持证据，有时甚至需要直接登录到业务系统中检查日志，这可能占据了他们超过30%，甚至50%的工作时间。

传统监控系统可能成为信息安全的伤口

传统的分散式监控系统建设模式，由于缺乏集中化的设计和规划，往往会导致管理层面的重大挑战。在这样的体系下，各种独立的监控系统和日志收集平台可能遍布于企业的各个角落，它们各自为政，缺乏有效的沟通和协调机制。这些分散的系统中，很可能存储和处理着大量的敏感信息，包括但不限于个人隐私数据、商业秘密、知识产权等，这些信息对于企业来说具有很高的价值和重要性。

然而，正是这些分散的系统，由于缺乏统一的管理策略和治理框架，使得对这些敏感信息的有效保护变得异常困难。企业可能无法对这些关键数据进行有效分类、风险评估和合规性审查。

此外，由于缺乏统一的数据访问控制和用户权限管理，敏感信息的安全性和保密性难以得到保障，增加了数据泄露的风险。不少情况下，工程师可能因缺乏监管而轻易地将监控系统的信息或者截图分享到公开平台以寻求相关的帮助，也许这些信息里面包含了一些企业重要数据，这样的案例如今已经屡见不鲜了。因此，引入全面的可观测性策略是实现IT基础设施有效管理和成本优化的关键。

结束语

在这个数字化时代，面对传统监控过度增殖所带来的挑战，如何有效管理众多分散且独立的监控系统成为企业战略举足轻重的一环。幸运的是，市场上已有一些综合性的监控解决方案能够为企业提供一个统一的数据视角，从根本上协助CTO们降低长期运维带来的的成本负担，优化整个监控流程。

观测云就是这样一款面向工程师的统一化全功能和全链路可观测性产品，助力企业快速洞察系统及业务运行状况并及时发现、解决问题。观测云具有强大的数据关联分析能力，帮助团队站在同一数据视角上无缝协作。这一策略不仅可以优化工作流程上的效率，还能促进跨部门间的沟通与协作，极大地提升协作效率与响应速度，确保所有团队都能基于统一的数据视角深入理解并有效解决问题，从而保障决策一致性与行动协同性。这对于快速定位问题、减少系统停机时间以及提高服务质量至关重要。与此同时，观测云也十分关注数据安全性，通过加强对访问权限的管理和数据加密等措施，确保数据安全和隐私保护，帮助企业建立完善的内部管理制度和技术防范措施，以应对潜在的安全风险。

对于首席技术官（CTO）来说，采纳这类先进的IT管理技术不仅仅是一次技术上的革新，更是一次管理理念的飞跃。通过这样的转变，企业将能够更好地适应不断变化的市场需求，实现可持续发展，迈向一个更加有效、安全且具备竞争力的数字化未来。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
AI马斯克泛滥：1分钟骗走退休老人几十万

随着AI人工智能的快速发展，网络上出现了各种各样逼真的篡改视频这也被不法分子利用，开始进行网络诈骗。AI生成的埃隆马斯克形象已经出现在数千条虚假广告中并导致数十亿美元的诈骗，并且已有人因此上当受骗。除了马斯克之外有其他的名人也被骗子利用，包括沃伦巴菲特、杰夫贝索斯等。

AI技术网络诈骗篡改视频
“AI马斯克”等深度伪造视频泛滥每年造成数十亿美元损失

AI生成的埃隆�马斯克的形象，已经出现在数千条虚假广告中，导致许多人被骗。AI驱动的“深度伪造”视频预计每年将造成数十亿美元的欺诈损失。AI行业正在快速发展，这些伴随产生的欺诈事件，需要AI行业和监管部门共同努力应对，以防止滥用。

AI技术深度伪造虚假广告
光智驾团队就有5个！曝吉利汽车重设CTO、研发团队大整合

快科技8月28日消息，36氪最新报道，进入今年二季度，吉利董事长李书福坐镇，总裁安聪慧操盘研发整合”，参与整合的对象包括吉利中央研究院和各子品牌背后的智驾、座舱、电子电气架构、电动力、整车平台等团队，以及后端的采购和供应链。报道指出，吉利控股集团旗下最核心的是吉利汽车集团，包含了吉利、领克、睿蓝、宝腾四个品牌，吉利研究院负责各品牌车型的功能研发，此外，吉利还有极氪、路特斯、沃尔沃和极星等独立子品牌，后者也都拥有不同规模的研发队伍。重复开发和多余资源消耗在所难免，多位吉利工程师直言称真的需要整合了，有?

吉利汽车研发整合李书福
Matrixport与Chainalysis合作利用链上数据监控加强监管合规性

“Chainalysis地址筛查是我们多方面运营的重要组成部分，显著提升了我们实时监控和降低加密货币交易风险的能力。”–WEIFENONGMATRIXPORT合规经理Matrixport是一家总部位于新加坡的一站式加密资产金融服务平台，是全球最大、受信任度最高的数字资产生态系统，其使命是满足投资者新兴的投资需求，并降低加密资产的准入门槛。Liu表示，“通过与Chainalysis合作，我们得以利用业界�

风险监控
极光高管访谈系列：CTO介绍JPush上架华为开发者联盟生态市场业务

极光作为首家在HarmonyOS生态市场上架的SDK服务商，七月下旬，国内某知名科技记者来到极光办公室，与极光的首席技术官张庆进行访谈。采访记者:近日，极光宣布了成为首家在HarmonyOS生态市场，完成推送类SDK上架的服务商，可否就这一消息和我们谈谈?张庆:随着HarmonyOS的快速发展，越来越多的开发者开始关注如何在该系统上实现高效、稳定的消息推送功能。张庆:很高兴可以和大家做分享。

极光 HarmonyOS SDK服务商
中国监控摄像头线上销量TOP10出炉：小米断崖式领先

快科技8月6日消息，据洛图科技（RUNTO）的数据报告，2024年上半年，中国消费级监控摄像头市场销量高达2791万台，实现了9.2%的同比增长；销售额达到56亿元人民币，微增1.1%。在线上市场的销量排名中，小米、乔安、萤石和普联稳占前四的位置，累计市场份额（CR4）为40.9%，较去年同期下降了2.6个百分点。小米在线上市场销量和销售额双双领先，市场份额均超过16%。该品牌在上半年推出了多款新产品，特别是800万像素的室内摄像头C700表现突出，上市当月便跻身畅销榜前十名。乔安在线上销量中位列第二，市场份额为11.5%，比去年同期增加了0.8个

监控摄像头消费级市场小米销售
中国监控摄像头线上市场最新TOP10出炉：小米双第一

快科技8月31日消息，根据洛图科技（RUNTO）的监测数据，2024年7月，中国监控摄像头在线市场的销售量达到200万台，呈现出1.5%的同比下降和7.8%的环比下降；销售额为4.5亿元，同比下降4.4%，环比下降8.2%。在市场占有率方面，小米、乔安、萤石和普联依然稳居前四，总市场份额（CR4）为38.8%，较去年同期下降了2.1个百分点。小米在销量和销售额两个指标上均名列第一，占比均超过16%。其推出的两款室内双摄产品C300和C500，进一步丰富了其多目产品线。乔安在销量上排名第二，市场份额超过10%，其主要销售的双目和多目产品依然是主力；7月份，?

监控摄像头中国市场销售数据
成本2000多元！苹果Vision Pro最关键的MicroLED屏成本逐步下降

Omdia研究分析师表示，苹果VisionPro售价高昂的主要原因之一是它的两块屏幕成本很高。VisionPro配备了两块4KMicroLED显示屏，大小是1.42英寸，像素超过2300万，像素密度为3386ppi。这意味着等到VisionPro二代上市时，苹果将会节省约33%的面板成本。

苹果 Vision Pro
共筑AI智能监控守护社会安宁新防线

“有了监控就算是停在路边的车钥匙忘了拔，也不会再担心被偷走了。”“安装了监控，让我们的安全得到了更大的保障”……自今年6月起，钦州移动灵山分公司陆续与灵山县内各乡镇镇政府、派出所及村委达成紧密合作，共同推进县内7个乡镇社会面AI监控系统的全面安装工作，得到了广大村民的一致好评。为积极响应乡村振兴战略，实现全县各村镇关键区域监控的全覆盖，�

AI监控系统乡村振兴社会安全保障
男孩在客厅被妈妈突然监控喊话吓哭：已向儿子表达歉意

8月14日，在湖北潜江发生了一件既有趣又温馨的小事。一位男孩在家中客厅独自玩耍时，被妈妈通过监控摄像头突然的喊话吓到。尽管一开始孩子被吓到，但妈妈的及时道歉和孩子的宽容理解，让这件小事成为了他们日常生活中的一段有趣回忆。

潜江监控摄像头亲子关系

BNA:多功能AI超级应用，涵盖社交、电商、娱乐和教育。

BNA AI Super App是一款集成了多种智能服务的超级应用，它不仅提供社交功能，如分享帖子、写博客、聊天和视频通话，还涵盖了AI电商和娱乐服务。此外，该应用还提供40种语言的AI教学服务，帮助用户学习不同的语言。BNA AI Super App以其强大的AI功能和多语言支持，满足了不同用户群体的需求。

AI 多语言学习社交

Elisi:高效能自主层级式计划助手

Elisi 是一款旨在帮助用户实现个人成长的终极组织者和指南。它通过直观的设计和用户友好的说明，帮助用户将梦想转化为清晰的结果，分解成可实现的里程碑，并通过AI技术理解并适应用户的个人需求，确保每一天都更有条理和高效。Elisi 致力于提供便捷服务，主要功能套件完全免费。

个人成长时间管理目标设定

Omi AI:个性化AI助手，记录每一刻，与AI对话获取反馈。

OMI APP是一个任务驱动的个性化AI助手，旨在通过语音和音频转录功能帮助用户提高记忆力和沟通效率。它是一个开源的AI记事本，提供提醒、建议等功能，同时注重用户隐私。

AI助手语音转录隐私保护

MeowMail:高送达率的AI电子邮件营销工具

MeowMail是一款集成在Shopify后台的电子邮件营销应用，利用AI技术自动选择最佳发送时间，提高邮件的送达率至98%以上。它支持拖放编辑、从Klaviyo导入邮件列表、使用Beefree编辑器创建新邮件，并通过设定支出限制来管理邮件营销活动。MeowMail还提供企业级支持和自动翻译文本功能，帮助商家以低成本实现高效的邮件营销。

邮件营销 AI技术 Shopify应用

Maia 100:微软定制AI加速器，专为大规模AI工作负载设计。

Maia 100是微软为Azure设计的首款定制AI加速器，专为大规模AI工作负载而打造，通过软硬件的协同优化，实现了性能、可扩展性和灵活性的最大化。它采用了TSMC N5工艺和COWOS-S互连技术，具备高达1.8TB/s的带宽和64GB的容量，支持高达700W的热设计功耗(TDP)，但以500W运行，确保了高效的能效比。Maia 100集成了高速张量单元、向量处理器、DMA引擎和硬件信号量，支持多种数据类型和张量切分方案，并通过以太网互连支持大规模AI模型。此外，Maia SDK提供了丰富的组件，支持快速部署PyTorch和Triton模型，并通过双编程模型确保高效的数据处理和同步。

AI加速器 Azure 大规模计算

LTM:超长上下文模型，革新软件开发

Magic团队开发的超长上下文模型（LTM）能够处理高达100M tokens的上下文信息，这在AI领域是一个重大突破。该技术主要针对软件开发领域，通过在推理过程中提供大量代码、文档和库的上下文，极大地提升了代码合成的质量和效率。与传统的循环神经网络和状态空间模型相比，LTM模型在存储和检索大量信息方面具有明显优势，能够构建更复杂的逻辑电路。此外，Magic团队还与Google Cloud合作，利用NVIDIA GB200 NVL72构建下一代AI超级计算机，进一步推动模型的推理和训练效率。

AI 软件开发上下文推理

EZ-work AI文档翻译:智能AI翻译，高效文档语言转换助手。

EZ-work AI文档翻译是一款专注于文档翻译的在线服务，支持多种语言的翻译，包括中文、英语、日语、俄语、阿拉伯语和西班牙语等。它使用先进的AI技术，如gpt-4o-mini和deepseek-chat模型，为用户提供快速、准确的翻译服务。该产品适用于需要文档翻译的个人和企业，尤其在国际交流和学术研究领域尤为重要。

翻译 AI 文档处理

Watson AI:会议助手，自动记录并总结会议要点。

Watson AI是一款会议助手应用程序，它通过录制系统音频和麦克风来转录和总结会议内容，自动提取行动项和会议摘要，帮助用户更高效地进行会议记录和回顾。

会议助手自动记录效率工具

PicTech AI: 免费在线AI图片翻译助力跨境电商

PicTech AI是由学以致用科技旗下的智能图像工具品牌，专注于为跨境电商提供AI驱动的图片翻译服务。该产品利用人工智能技术，实现高准确率和高清晰度的图片翻译，支持中文、英语到日语、韩语等多国语言的翻译。PicTech AI的智能抠图功能，能够准确检测图片主体边缘，一键去除背景，无需专业编辑。产品背景信息显示，其团队由来自百度、网易、阿里巴巴等行业巨头的顶尖高科技人才组成，具备强大的技术实力和产品能力。该产品定位于帮助跨境电商从业者简化工作流程，提高效率，无需懂外语或图像处理技能即可使用。

AI翻译跨境电商智能抠图

AnythingLLM:一站式AI应用，支持多种文档和模型。

AnythingLLM是一个多功能的桌面客户端，支持多种语言模型（LLM）和文档类型，提供完全私密的使用体验。用户可以根据自己的需求选择企业级模型、自定义模型或开源模型，如GPT-4、Llama、Mistral等。产品支持一键安装，本地运行，无需互联网连接，保护用户隐私。

AI 文档处理隐私保护

林哥的大模型野榜:更适合中国宝宝体质的大模型产品排行榜

林哥的大模型野榜是一个专注于中国用户需求的大模型产品排行榜，提供了多维度的评估和排名，帮助用户更好地了解和选择适合的大模型产品。

大模型排行榜多维度评估

Fluximg.com:AI文本到图像生成器，支持多尺寸和自动翻译。

Fluximg.com是一个基于Flux模型的AI图像生成网站，提供从文本到图像的转换服务。它支持多种语言，包括中文和英文，并且具有用户友好的界面。网站提供免费和专业版本，使用户能够根据自己的需求选择不同的服务级别。

AI图像生成多尺寸自动翻译

现代文转古文:将现代汉语转化为古汉语，提升文采。

现代文转古文是一款能够将现代汉语自动转换为古汉语的模型，它通过先进的自然语言处理技术，使得用户可以轻松地将现代文本转换成具有古典韵味的古文。这种转换不仅能够增加文本的文学价值，还能在教育、文学创作、文化传承等方面发挥重要作用。

古文文学转换

Zamba2-mini:先进的小型语言模型，专为设备端应用设计。

Zamba2-mini是由Zyphra Technologies Inc.发布的小型语言模型，专为设备端应用设计。它在保持极小的内存占用(<700MB)的同时，实现了与更大模型相媲美的评估分数和性能。该模型采用了4bit量化技术，具有7倍参数下降的同时保持相同性能的特点。Zamba2-mini在推理效率上表现出色，与Phi3-3.8B等更大模型相比，具有更快的首令牌生成时间、更低的内存开销和更低的生成延迟。此外，该模型的权重已开源发布(Apache 2.0)，允许研究人员、开发者和公司利用其能力，推动高效基础模型的边界。

监控系统泛滥：CTO 面临的隐形成本危机

今日大家都在搜的词：

热文

站长商机