現代のITインフラはクラウド移行が進み、もはや静的なシステムではなくなった。短期間で立ち上がり、入れ替わるインスタンスやコンテナの運用が当たり前となり、固定サーバー前提の従来の監視手法だけでは対応が難しい時代である。このような動的な環境では、個々のサーバーに注目するのではなく、システム全体の傾向を把握し、異常を即座に検知・対応する力である。Datadogは「すべてを測定する」「優れたデータを収集する」「本当に重要な問題にアラートを発行する」という3つの柱を軸に、クラウドスケールの監視手法を体系化してきた。
本資料では、AWSなどの動的インフラに適応するための監視の原則と、Datadogが実践する具体的なアプローチを紹介する。
ホワイトペーパー
