该功能提供对 PaaS 环境中容器化应用程序状态的全面可见性。通过聚合资源利用率、错误率和网络连接等实时指标,该系统赋能 DevOps 工程师,使其能够主动识别潜在的性能瓶颈,从而在影响服务可用性之前进行干预。编排层将日志与基础设施遥测数据关联,从而提供可操作的洞察,用于自动进行扩展或修复,无需人工干预。
该系统持续采集所有已部署容器的遥测数据,并将各种指标标准化,从而提供应用程序健康状况的统一视图。
异常检测算法能够自动识别与基准性能的偏差,仅当阈值指示出现严重性能下降时才会触发警报。
相关性引擎将容器级别的事件映射到底层的基础设施状态,从而在事件发生时提供分析根本原因的上下文信息。
在每个容器环境中部署监控代理,以开始收集遥测数据。
针对不同工作负载的特点,配置 CPU、内存和网络指标的基准阈值。
启用关联规则,将容器健康事件与基础设施层异常关联。
检测到重大性能下降时,自动将告警信息路由至指定渠道。
实时可视化聚合健康指标和每个容器的资源利用率图表,以便快速了解系统状态。
自动化的通知渠道,用于在关键阈值被突破时提供警报,并附带上下文日志以及推荐的补救措施。
提供程序化接口,允许外部监控工具或CI/CD流水线获取历史指标数据,并触发自动扩展策略。