企业级遥测
企业级遥测是指从企业环境内复杂的、大规模的IT系统、应用程序和基础设施中,全面、持续地收集和传输操作数据——包括指标(metrics)、日志(logs)和追踪(traces)。它超越了简单的正常运行时间检查,能够捕获关于整个技术栈在真实业务负载下如何运行的深度行为数据。
在现代的分布式架构(如微服务)中,精确定位性能下降或故障的根本原因极其困难。企业级遥测提供了必要的可见性。它使IT和业务利益相关者能够从被动的“救火”转变为主动的性能管理,确保技术直接支持业务目标。
遥测通过对应用程序和基础设施组件进行“仪器化”(instrumenting)来运行。代理(Agents)或软件开发工具包(SDKs)被嵌入到系统中,以发出三种主要数据类型:
这些数据流被聚合、处理并存储在集中的可观测性平台中进行分析。
主要优势包括提高系统可靠性、降低平均解决时间(MTTR)以及获得关于运营效率的数据驱动的洞察。通过了解大规模的系统行为,组织可以优化云支出并加速功能交付。
实施企业级遥测带来了挑战,特别是数据量管理(生成数据的巨大规模)、确保跨不同系统的安全性和合规性,以及在遗留和现代应用程序中建立标准化的仪器化。
这个概念与可观测性(Observability)密切相关,可观测性是指从系统的外部输出推断其内部状态的能力。虽然遥测是数据收集机制,但可观测性是从这些数据中得出的分析能力。