ようこそSREの世界

SREを通じたデータドリブンな運用の世界

手塚卓也 (スリーシェイク)

2022-03-28 06:00

 前回の記事では、各組織の体制や文化が異なる中で、どのような目的、意図をもって進めていけば、Site Reliability Engineering(SRE)の導入につなげられるかのプラクティスについてお話しました。

 今回は、SREにおけるデータを測定する重要さ、データの種類と収集方法、システムの運用での活用について紹介します。

データを測定する重要さ

 まず、SREとDevOpsがどのように関係しているかを踏まえてお話します。表1は、Googleが提唱する「class SRE Implements DevOps」です。DevOpsは思想、SREは具体案と捉える考え方です。その中に、「Measure everything(全てを測定する)」という思想があります。「SRE サイト リライアビリティ エンジニアリング」からも引用しますが、DevOpsの一面として、「Measurement Is Crucial(測定は重要である)」と述べられています。

測定は重要である
最後に、サイロの解消やインシデントの解決など、ビジネス全般において測定は特に重要です。これらの環境では、客観的な測定によって何が起こっているのか、現実を確認し、期待通りに状況が変化しているかどうかを検証し、異なる機能が合意する会話のための客観的な基盤を作るのです(これはビジネスだけでなく、オンコールなど他のコンテキストにも当てはまります)。
(出展:「SRE サイトリライアビリティエンジニアリング Chapter 1 - How SRE Relates to DevOps」)

 その目的は、サイロやシステム障害(インシデント)、ビジネス全般における課題解決です。SREは、「オペレーションはソフトウェアの問題である」と捉え、これらの課題を解決するためにはどのように、どのようなデータを測定し、分析していくかを規定していきます。

(参考:What’s in Your Google Cloud DevOps Toolbox ?)
(参考:What’s in Your Google Cloud DevOps Toolbox ?)

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    ChatGPTに関連する詐欺が大幅に増加、パロアルトの調査結果に見るマルウェアの現状

  2. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  3. セキュリティ

    警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集

  4. セキュリティ

    いま製造業がランサムウェアに狙われている!その被害の実態と実施すべき対策について知る

  5. セキュリティ

    ランサムウェア攻撃に狙われる医療機関、今すぐ実践すべきセキュリティ対策とは?

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]