この機能により、シニアサイト信頼性エンジニアは、特定のインフラストラクチャのメトリクスに合わせてカスタマイズされた監視インターフェースを構築できます。このシステムは、ログ、トレース、およびテレメトリデータを集約し、計算リソースの利用状況における異常を強調する動的な可視化を生成します。その結果得られるダッシュボードは、手動での集計ツールを必要とせずに、積極的なインシデント管理とキャパシティプランニングのための具体的な情報を提供します。
システムは、様々なコンピューティングノードから収集される大量のログデータとメトリクスデータを統合し、可視化のための統一的なデータ基盤を構築します。
エンジニアは、ダッシュボード構築ツール内で、カスタムのクエリパラメータと閾値アラートを定義し、これにより、現在の運用上の課題に合わせた適切な設定が可能です。
リアルタイムレンダリングエンジンがこれらの入力を処理し、リソース使用状況とアプリケーションの健全性指標を関連付けるインタラクティブなグラフを表示します。
ダッシュボードに必要な具体的な計算指標を定義します。例えば、レイテンシやエラー率などです。
対象となるインフラストラクチャクラスタからログとテレメトリデータを収集するために、データソースを設定します。
ダッシュボード内で、閾値超過時に通知をトリガーする自動アラートルールを設定します。
カスタマイズされたビューを監視プラットフォームに展開し、直ちに運用に活用してください。
すべてのコンピューティングインスタンスから構造化されたログデータを収集し、集中型のパイプラインを通じてダッシュボードに提供します。
CPUやメモリの使用率などのパフォーマンス情報を、可視化を支える時系列データベースに送信します。
SRE担当者が、ライブデータストリームに基づいてウィジェットをドラッグ&ドロップで配置し、アラート条件を設定するためのインターフェースを提供します。