首页 > 传媒 > 关键词  > 日志分析最新资讯  > 正文

利用观测云打造企业级的统一日志中心

2024-04-24 14:41 · 稿源: 站长之家用户

前言

在数字化转型时代,现代的大规模应用程序每天可以生成数以亿计的日志数据。它是企业运营和管理中的宝贵资产,记录了系统、应用和设备的各种活动和事件。通过分析日志数据,企业可以深入了解业务运行情况、识别潜在问题和优化机会,提升系统稳定性、安全性和性能表现。因此,企业构建“统一日志中心”的必要性是显而易见的,它可以集中管理和分析各类日志数据,实现全面监控、快速响应和深度分析,帮助企业实现故障排除、安全审计性能优化等目标,提高运营效率、降低风险,并为业务发展提供有力支持。

观测云秉承“统一采集、统一处理、统一分析”的理念,构建了一套有效的观测数据分析平台。本文从日志采集、处理、存储、分析的各个过程,分别观测云如何帮助企业又快又好地建设统一日志中心。

观测云日志采集能力

在采集方面,观测云的统一数据采集器DataKit拥有丰富的采集模板和强大的集成扩展能力,能够使用采集磁盘文件、容器stdout、接收远程推送日志、sidecar方式采集日志等多种方式,以适应企业异构的IT环境和多元的日志采集需求。

观测云对不同日志的处理方式

DataKit内置了操作系统日志、容器日志、MySQL & Nginx等常用数据库和中间件的采集器,能同时采集监控对象属性、指标数据(Metric)、日志数据(Log),用统一采集的理念最 大程度上减少部署在监控对象上的agent数量。

DataKit采集器的运行管理十分方便,在K8S环境中,DataKit会以DaemonSet方式运行,确保在每个节点上都会运行一个日志采集器 Pod,从而实现对整个集群的日志数据全面覆盖。无论集群中有多少个节点,都能保证每个节点的日志都被实时采集。观测云还提供了DCA(DataKit Client Agent),它是一个用于批量管理DataKit的工具。通过DCA,用户可以更加方便地对DataKit状态、日志解析模板、黑名单等配置进行批量操作和维护,从而提高数据采集的效率和准确性。

对于已经使用开源agent采集日志的企业来说,通常倾向于将原有agent采集的日志转发给新建设的统一日志中心。观测云可使用Fluentd、Logstash、Kafka、API等方式来接收已采集的日志,充分保留企业过往的技术投入并减少替换成本。

观测云日志处理能力

在日志处理过程中,观测云内置了十余种常用数据库&中间件的官方日志解析模板,包括Kafka、Elasticsearch、MySQL、Nginx、Redis、Tomcat、MongoDB等,方便用户直接使用。另外还提供了数十个脚本函数,让用户可以按照不同的日志处理场景进行快速引用,实时进行调试。

例如,很多企业希望在日志采集时对日志中的敏感信息进行脱敏,则可以使用观测云Pipeline中的脱敏函数对指定字段范围做数据脱敏,即可在采集侧完成脱敏处理,避免了敏感信息在互联网传输带来的合规性问题。

再如,很多企业也提到了希望能配置采集端黑名单,以减少宝贵的带宽资源,降低中心化处理的性能开销。在观测云上,您可以通过drop函数(丢弃整条日志或某个字段)、sample函数(对日志进行采样),或者是配置日志黑名单来达到上述目的。

对于模板不能适配的日志格式,观测云也提供了多种方式让用户能轻松完成日志解析。首先是在Pipeline解析过程中提供了“一键获取样本”并实时调试的能力,让用户可以实时查看Pipeline对日志的处理是否满足需求。同时为了降低编写Pipeline的难度,观测云还提供了交互式的命令行工具,帮助用户快速选择适合某个字段的函数。

交互式命令行工具,降低日志解析难度

此外,Pipeline还支持通过openAPI进行导出、导入,以便在集团性组织在创建工作空间时直接引用,快速将已经调整好的Pipeline分发给不同业务系统,提升业务团队的使用体验。

值得一提的是,对于在日志采集中经常遇到的多行日志采集问题,观测云提供了自动多行模式、自定义多行模式的方式。自动多行模式会根据特定的起始标记、结束标记、正则表达式等来进行多行日志的识别,降低用户的使用负担。

观测云日志存储能力

观测云在面向全球用户提供SaaS服务的过程中,需要实施处理并存储海量的日志,如何在成本与用户体验间保持平衡,观测云付出巨大努力。在过去使用elasticsearch/opensearch方案时,我们发现该方案存在写入占用资源多、对无模式表支持较差、聚合查询性能差等问题。因此观测云在经过严谨的调研、开发、测试之后推出了全新架构的GuanceDB。

GuanceDB满足了观测云对 Schema Free 的要求,解决了数据 Schema 频繁变化痛点;提高了数据写入的性能,保证了数据写入的时效性和查询的实时性;提升了全文检索的性能并降低查询的资源开销...... 总而言之,观测云最终实现:仅使用 Elasticsearch 的1/3成本、获得2~4倍的性能提升,整体性价比提升了近10倍!

为了满足企业对日志的长期保存需求(通常出于日志审计的考虑),同时又要兼顾存储成本,观测云提供了“数据转发”功能,便于观测云提供日志等数据保存到观测云的对象存储及转发到外部存储的功能,您可以自由选择存储对象,灵活管理数据转发数据。在数据转发页面,您可以通过设置查询时间和数据转发规则快速查询存储数据(包含观测云备份日志、AWS S3、华为云 OBS、阿里云 OSS 和 Kafka 消息队列),还可以在无需额外处理的情况下,直接在观测云上查看历史备份日志和 SLS Query Logstore 数据。

观测云日志分析能力

DQL(Debug Query Language)是观测云开发的数据查询语言。DQL支持在观测云工作空间或者终端设备进行数据查询,允许用户检索和分析存储在观测云中的各种数据,包括日志、指标、链路追踪等。

得益于DQL统一查询语言和统一风格的“查看器”,用户在观测云上无论是分析日志、链路、RUM(用户体验数据)时都有一致性的体验,同样的简单易用、同样的秒级查询体验。

常用搜索历史模板、快捷筛选、字段补全等功能,在观测云上都一应俱全。考虑到团队在排查故障、分析异常过程中经常会有数据共享的需求,观测云设计了贴心的“快照分享”,团队成员可以创建自定义时间段即时拷贝的数据副本,并生成指定查看权限的快捷访问链接。团队可以通过一个浏览器链接分享日志数据,并且可以保留分享者在日志上做过的时间筛选、条件筛选,该快照也并非是单一的静态数据,而是可以交互的日志分析界面,大大降低了团队间使用截图、发送原始日志的沟通成本。出于对数据安全性的考虑,分享者可以对快照设置字段脱敏、添加水印、设置有效时间、链接加密、访问IP白名单等多种特性,在信息有效传递的同时充分保证数据的安全性,便于团队间、外部企业进行协作。

对于很多企业来说,特别担心采集的日志中存在敏感数据,但在日志的采集、存储、分析过程中极其难以发现。为了解决这个问题,观测云开发了“敏感数据扫描”功能,内置了近百个敏感数据规则库,并允许用户自定义新建敏感数据规则,通过引用这些规则来对存储在观测云中的日志数据进行主动扫描,一旦发现敏感字段即可进行加密,确保数据合规性。

此外,观测云还支持通过“数据访问”功能为不同角色配置对应的日志数据访问查询范围,以实现数据查询范围的精细化管理。例如负责不同业务系统的团队、同一团队中根据角色区分不同的日志权限,都可以灵活进行配置。

在“日志智能检测”功能中,观测云运用智能检测算法,监控工作空间内采集器产生的日志数据。智能识别日志数量的突增 / 突降、错误日志的突增的异常数据,及时发现不符合预期的异常状态,及时提醒团队关注业务是否有异常表现。

日志突增的智能检测 

总结

当企业考虑构建统一日志中心时,通常需要考虑功能需求、可扩展性、安全性、兼容性、性能和效率、成本效益与用户体验。相信经过上面的介绍,您对观测云的日志分析能力拥有了比较全面的认识。观测云一直致力于为用户提供更好、更优的可观测能力,相信是企业构建统一日志中心、统一可观测平台的理想选择。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 京东云升级JoyAgent 2.0:分钟级生成企业级专业数字员工

    京东云在上海发布九大AI产品,包括JoyAgent智能体2.0、JoyBuild大模型开发平台等,助力企业重构AI基础设施。京东集团技术委员会主席曹鹏表示,数字员工上岗率将成为衡量企业先进性的标准。JoyAgent 2.0具备三大核心能力:主动分析执行、丰富工具链和多智能体协同,已在研发、政务服务等场景深度应用。目前京东内部智能体数量超14000个,覆盖零售、物流等多个领域,显著提升工作效率。该平台还接入数十个大模型,提供100多个行业解决方案模板,支持企业快速构建专属智能体。

  • 火山引擎Data Agent体验中心正式上线!企业级AI数据专家触手可及

    火山引擎数智平台开放企业级数据智能体Data Agent体验中心,用户可零门槛体验"企业数字专家"在数据垂直领域的深度能力。该产品定位为"企业第一位AI数据专家",已上线股票分析、经营复盘、营销策略等6大场景应用。通过"数据+知识"融合、人机协同等核心价值,突破传统分析工具边界,实现从描述性分析到行动建议的跨越。作为L3级智能体,它能将企业内外部信息转化为可量化数字资产,显著降低数据使用门槛,提升决策效率。Gartner预测到2028年至少15%的日常决策将由AI自主完成。火山引擎此举标志着企业数据应用正式进入"动态智能体"时代。

  • 铭凡推出MS-A2迷你工作站:搭载锐龙9 7945HX处理器、自带双万兆SFP+、支持U.2企业级硬盘

    5月23日,MINISFORUM推出MS-A2迷你工作站,搭载AMD锐龙9 7945HX处理器(16核32线程,最高5.4GHz)和Radeon 610M核显。机身仅1.78L/1.4kg,支持96GB DDR5内存和23TB存储(3个U.2硬盘位)。配备双10G SFP+和双2.5G网口,支持65Gbps聚合传输,另有丰富扩展接口包括40Gbps USB4。内置PCIe4.0×8插槽可扩展独显,适合NAS、虚拟机等多场景使用,售价3599元起。

  • 抖音集团成立“短剧版权中心”:统一向红果短剧、抖音等平台提供内容

    抖音集团5月29日宣布成立"短剧版权中心",旨在加强版权管理、提升短剧质量,支持优质制作方和创作者。该中心整合了抖音短剧和红果短剧相关团队,将统一向各平台提供短剧内容,并负责与创作者合作。调整后,所有涉及抖音集团短剧的合作需由版权中心决策。目前国内短剧市场规模已超电影市场,接近长视频流媒体市场的70%,预计2027年将达910亿元。抖音通过"辰星计划"激励精品短剧创作,推动行业向精品化、规模化发展。

  • 年度攻防演练专题|开箱即用、无性能消耗,基于云DNS日志发现威胁

    文章揭示了DNS系统在数字化时代面临的安全威胁,主要包括三种攻击手法:1) 利用log4j漏洞进行内网探测,通过DNS请求外带数据;2) 僵尸网络使用TXT记录传递加密指令实现远程控制;3) 劫持DNS解析将合法域名指向恶意IP。这些攻击都会在DNS日志中留下可追踪特征。当前企业面临三大监测痛点:海量日志分析效率低、威胁情报能力弱、传统产品性能损耗大。腾讯云安全中心基于实战经验开发了DNS威胁监测工具,支持智能分析千万级请求日志,快速定位恶意请求,识别挖矿、远控木马等风险,并通过"非白即黑"基线策略监测异常行为,将DNS从基础设施升级为安全战略核心节点。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 世界目光聚焦!万家丽商圈以消费者为中心,打造中国商业新高度

    2025年6月10日,万家丽国际购物广场举办"消费者购物文化达人表彰大会",集团董事长黄志明等领导出席。活动表彰了刘凡菲等300位来自全球的购物文化达人,展现万家丽"大而专、专而全、全而精"的第四代商业模式。作为全球最大单体高层建筑,万家丽融合多元文化业态,提供一站式购物体验,其贴心服务获得消费者高度认可。未来集团将持续深化消费激励体系�

  • 苹果的下一步计划:利用开发者社区,打造AI应用!

    苹果正在用自己最擅长的方式,激活这场 AI 革命 —— 那就是信任并赋能它的开发者……

  • 为何头部企业都选 Testin云测?揭秘 AI 测试的核心竞争力

    文章探讨了软件定义时代下数字化转型带来的质量新命题。在金融、汽车、人工智能三大领域,软件已成为企业战略核心载体:金融科技投入持续增长,汽车行业"软件定义汽车"重构竞争格局,AI与传统软件融合催生新范式。同时指出软件质量缺陷可能引发的连锁反应,强调软件测试已突破传统质控范畴,成为企业数字化竞争的基础设施。Testin云测通过AI测试技术,在大模型应用、金融行业、智能座舱三大场景实现突破:构建全机型覆盖矩阵、创新无码化脚本开发、优化自动化分层策略,显著提升测试效率与资产复用率。未来趋势将向智能化、场景化、全生命周期管理演进,AI技术从辅助测试向自主决策升级,推动测试环节从"成本中心"向"价值中心"转型。

  • 打造“全球一朵云”,广汽迈入出海3.0时代

    2024年中国汽车产销量突破3100万辆,出口量达585.9万辆,位居全球第一。广汽集团加速海外布局,提出One GAC2.0战略,从贸易出口向海外运营转型,构建"研产销服"全产业链全球化布局。面对合规、数据安全等挑战,广汽与阿里云合作,采用"区域中心+国家站"混合架构云服务,打造"全球一朵云"数据底座,降低50%存储成本。在AI领域,广汽基于阿里云PAI平台构