此功能允许高级站点可靠性工程师构建定制的监控界面,以适应特定的基础设施指标。该系统通过聚合日志、追踪和遥测数据,生成动态可视化图表,突出显示计算资源利用率中的异常情况。生成的仪表盘提供可操作的洞察,可用于主动的事件管理和容量规划,无需使用手动聚合工具。
该系统接收来自各种计算节点的超大量日志流和指标数据,以构建统一的数据基础,用于可视化分析。
工程师可以在仪表盘构建器中自定义查询参数和阈值告警,以确保其与当前的运营挑战相关。
实时渲染引擎会处理这些输入,以显示交互式图表,这些图表将资源使用情况与应用程序健康指标相关联。
定义仪表盘所需的具体计算指标,例如延迟或错误率。
配置数据源,以从目标基础设施集群中提取日志和遥测数据。
在仪表盘中设置自动化告警规则,以便在超出阈值时触发通知。
将定制视图部署到监控平台,即可立即投入使用。
收集来自所有计算实例的结构化日志数据,并将其汇集到集中式管道中,以供仪表盘使用。
将诸如CPU和内存利用率等性能指标数据推送至驱动可视化功能的时序数据库。
为 SRE 工程师提供一个界面,允许他们通过拖放组件并根据实时数据流配置告警条件。