クラウドがインフラ運用の標準になったいま、システムのあり方は大きく変わっている。固定されたサーバーを前提にした従来型の監視では、常に流動するクラウド環境に対応できなくなった。個々のサーバーやコンテナではなく、全体のサービスの健康状態に目を向け、リアルタイムで異常を検知し、対応する力が求められている。このような環境に適応するために、Datadogは新しい監視のあり方を体系化した。「すべてを測定」「優れたデータを収集」「本当に重要な問題にアラートを発行」この3つを軸に、従来の静的な監視ではとらえきれない動的なインフラの状態を、リアルタイムに可視化し、守り続けることを目指している。そこで鍵になるのが、ワークメトリクスやリソースメトリクスといった、生きたシステムの状態を的確に捉える指標である。個々のコンポーネントに固執せず、サービス全体の健康をリアルタイムに見極める。この視点なしには、動的で複雑な現代のインフラを安定して運用することは難しい。とりわけ、AWSをはじめとするクラウド環境では、インフラそのものが流動的に組み替えられ、刻一刻と姿を変えていく。
本資料では、こうしたダイナミックなインフラストラクチャを前提に、なぜインフラを「ペットではなく家畜」として扱うべきなのか、そして変化を前提としたモダンな監視アプローチをどのように実践していくかを紹介する。
ホワイトペーパー