ようこそSREの世界

SREを通じたデータドリブンな運用の世界

手塚卓也 (スリーシェイク)

2022-03-28 06:00

 前回の記事では、各組織の体制や文化が異なる中で、どのような目的、意図をもって進めていけば、Site Reliability Engineering(SRE)の導入につなげられるかのプラクティスについてお話しました。

 今回は、SREにおけるデータを測定する重要さ、データの種類と収集方法、システムの運用での活用について紹介します。

データを測定する重要さ

 まず、SREとDevOpsがどのように関係しているかを踏まえてお話します。表1は、Googleが提唱する「class SRE Implements DevOps」です。DevOpsは思想、SREは具体案と捉える考え方です。その中に、「Measure everything(全てを測定する)」という思想があります。「SRE サイト リライアビリティ エンジニアリング」からも引用しますが、DevOpsの一面として、「Measurement Is Crucial(測定は重要である)」と述べられています。

測定は重要である
最後に、サイロの解消やインシデントの解決など、ビジネス全般において測定は特に重要です。これらの環境では、客観的な測定によって何が起こっているのか、現実を確認し、期待通りに状況が変化しているかどうかを検証し、異なる機能が合意する会話のための客観的な基盤を作るのです(これはビジネスだけでなく、オンコールなど他のコンテキストにも当てはまります)。
(出展:「SRE サイトリライアビリティエンジニアリング Chapter 1 - How SRE Relates to DevOps」)

 その目的は、サイロやシステム障害(インシデント)、ビジネス全般における課題解決です。SREは、「オペレーションはソフトウェアの問題である」と捉え、これらの課題を解決するためにはどのように、どのようなデータを測定し、分析していくかを規定していきます。

(参考:What’s in Your Google Cloud DevOps Toolbox ?)
(参考:What’s in Your Google Cloud DevOps Toolbox ?)

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. ビジネスアプリケーション

    【マンガ解説】まだ間に合う、失敗しない「電子帳簿保存法」「インボイス制度」への対応方法

  2. ビジネスアプリケーション

    きちんと理解できていますか?いまさら聞けないインボイス制度の教科書

  3. 運用管理

    AWS、GCP、Azureを中心としたクラウドネイティブ環境における5つのセキュリティ強化策

  4. セキュリティ

    マンガでわかる―Webサイトからの情報搾取を狙うサイバー攻撃「SQLインジェクション」、どう防ぐ?

  5. セキュリティ

    緊急事態発生時にセキュリティを維持するための8つの戦略と危機管理計画チェックリスト

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]