指_MODULE
可観測性およびログ収集

指標収集

計算ノードから大量のテレメトリデータを収集し、Prometheusの時間系列形式に変換することで、リアルタイムの監視とGrafanaによる可視化ダッシュボードを実現します。

High
SRE
Group discusses data displayed on a large screen near server racks and technical equipment.

Priority

High

Execution Context

この機能は、コンピューティングインスタンスによって生成されるパフォーマンスメトリクスの収集、正規化、および保存を統合的に管理します。CPU、メモリ、およびネットワークの統計情報を、低遅延で中央のPrometheusバックエンドに収集することを保証します。システムは、サーバーにデプロイされたエージェントを自動的に監視し、データを標準の時系列プロトコルに従って整形し、Grafanaのダッシュボードから即座に取得できるようにインデックスを作成します。このプロセスは、リソースのボトルネックを検出し、サービスの可用性を維持するために不可欠です。

システムは、登録されたすべてのコンピューティングエージェントに対して、現在のメトリクスの一時スナップショットを取得するための、スケジュールされたデータ収集サイクルを開始します。

収集されたデータは、Prometheusのデータ取り込みパイプラインにストリーミングされる前に、スキーマの制約に対する検証が行われます。

処理されたメトリクスは、すぐにGrafanaのダッシュボードでの可視化や、アラートルールのトリガーに使用できます。

Operating Checklist

対象となるインフラストラクチャノードに、コンピューティングエージェントをデプロイしてください。

Prometheusのスクレイプ設定を構成し、エージェントのエンドポイントを特定します。

定期的なスクレイピングサイクルを実行し、生のメトリクスデータを収集します。

集計されたデータをインタラクティブなGrafanaの可視化に変換します。

Integration Surfaces

計算エージェント

サーバーにインストールされるエージェントソフトウェアで、内部ハードウェアカウンタおよびアプリケーションのパフォーマンスデータを公開します。

Prometheusサーバー

時系列データベースであり、メトリクスデータの取り込み、保持ポリシー、およびクエリ実行を集中管理します。

Grafana ダッシュボード

SRE監視運用向けの、リアルタイムチャート表示機能とアラート機能を提供する可視化レイヤー。

FAQ

Bring 指標収集 Into Your Operating Model

Connect this capability to the rest of your workflow and design the right implementation path with the team.