ITインフラストラクチャの自律化で実現される機能とは
インフラ自律化の本質的なゴールは、ITインフラの自己管理によって、利用者・開発者・運用者が低レベルのタスクから解放され、本来の業務にもっと集中できるようになることです。自律化の仕組みをうまく取り入れるためには、「最終的に何をすべきか?」という質問に答えることが重要です。
ゴールを認識できたら、次は自律化のメカニズムについて理解しましょう。ITインフラの自律化をシンプルにモデル化したのが、MAPE(Monitor、Analyze、Plan、Execute)ループ(図1)です。

図1:自律化のメカニズム
新たなビジネスモーメント(ビジネス契機の瞬間)が生じて、エンタープライズITに俊敏性や伸縮性が求められた結果、ハイブリッドクラウドやマルチクラウドの利用が進みました。その一方、システム全体の運用管理が複雑化することで、運用担当者の管理能力を超えないようにしなければなりません。
そのためには、ITインフラの自律化をモデル化したメカニズムであるMAPEループから整理を始めていくといいでしょう。例えば、クラウド環境ごとに乱立したオープンソースソフトウェア(OSS)の運用ツールを整理し、適切なタイミングで動かすことで、ITインフラのコストやリスクを削減し、ビジネス革新を加速することができます。
運用管理サービス「Oracle Management Cloud」では、ハイブリッド/マルチクラウド環境のITインフラに対して、MAPEループを実装可能です。図2は、オーケストレーション機能を使ってシステムを自動修復させる設定画面です。監視対象の指定から修復動作の設定まで、MAPEループに従って適切なタイミングで対処を実行することができます。

図2:Oracle Management Cloudの自動レスポンス設定
ITインフラの自律化をどのように導入・運用すべきか
インフラ自律化の導入ステップは、(1)監視メトリクスの自動化、(2)機械学習による分析の自動化、(3)自動レスポンスによるアクションの自動化です。

図3:インフラ自律化の導入ステップ
・1stステップ:監視メトリクスの自動化
Oracle Management Cloudでは、システム開発者がコードをデプロイすると、インフラ側で関連するアクティビティと監視メトリクスが自動的に生成、公開されます。開発者や運用者は、特別な作業をすることなく監視メトリクスの自動化を実装できるわけです。
・2ndステップ:機械学習による分析の自動化
監視メトリクスの理解は、開発者や運用者の双方にとって学習コストの高いものです。ITインフラ内の数百万のログ、数万のアクティビティ、構成メトリックを把握するに越したことはないのですが、迅速な復旧や拡張には不要な知識です。
こうした過剰なデータに対処するには、機械学習が有効です。運用管理者が監視の仕組みを考えるのではなく、機械学習ベースの分析機能がシステムの挙動を学習し、本来どのように動作すべきかを考えます。
Oracle Management Cloudの分析機能は機械学習を活用しています。それにより、差し迫った問題を予測したり、進行中の問題の根本原因を特定したりする機能を提供します。例えば、潜在的な問題が発生するクラスタの数や異常値の数、クラスタ全体で同じ形状を持つトレンドの数など、膨大な量のログイベントから少量のパターン情報へと集約するような分析を積極的に支援します。
・3rdステップ:自動レスポンスによるアクションの自動化
監視メトリクスの自動化、機械学習による分析の自動化に続く、3つ目のステップは自動レスポンスによるアクションの自動化です。APIやスクリプトを連携させることでアクションの自動化を実装します。
Oracle Management Cloudの場合、オンプレミス環境や他社のクラウド環境についても、APIやスクリプトを連携させることができます。ハイブリッドクラウド化やマルチクラウド化が進んだエンタープライズITのインフラ自律化を後から組み込むことも可能です。