「クラウド障害によるビジネスへの影響が拡大する中、IT基盤の復旧対策を準備しない企業はビジネスの停止リスクを伴うことになる」――。ガートナージャパンは9月27日、クラウドへのシフトが進むIT基盤のレジリエンスについて、このような見解を発表した。
企業ITシステムのクラウド利用が進む中、障害発生によってサービス停止する事態がしばしば発生しており、ビジネスへの影響が懸念されている。ディレクター アナリストの山本琢磨氏はこうした状況について、「ITによって発生するビジネスの停滞を軽減するには、クラウドを中心とするIT基盤のレジリエンスを高める必要がある。インフラストラクチャー/オペレーション(I&O)のリーダーは、『安定的にできるだけ継続的に稼働させる』ための可用性と、『障害時にできるだけ早く復旧させる』迅速なリカバリー性を両立、向上させることが重要」と語る。
クラウドを利用したシステムの継続的可用性を高めるには
ガートナーが2023年4月に実施した調査で、ITインフラ領域の予算やテクノロジーの選択に関する決定権を持つ役職を対象に、ITの停止やデータ損失などによるビジネスのリスクを把握しているかを尋ねたところ、把握していると回答した割合はわずか22.3%だった。
クラウドのデータセンターは堅牢であり、クラウドサービスが止まるようなことはないだろうと考えている経営層は少なくない、と同社は指摘。こうした企業でクラウド障害が起こり、社内の何らかのITサービスが停止すると、IT部門は対応に追われることになり、結果的に実際の解決策への着手が遅れるなど、IT部門の業務にも悪影響を及ぼしてしまう。
この状況を打開するには、経営層および組織全体に正しい知識を周知することだという。1つ目は、「クラウドはしばしば止まる」が、多くの場合その障害は小規模、局所的、短時間であり、ケースによってはその障害を回避することもできる、という点。もう1つは、クラウドの障害の多くは「ソフトウェアの不具合によるもの」であり、災害やデータセンターの壊滅につながるような障害ではない、という点になる。
山本氏は「もし自社の経営層がクラウドに対して『絶対止まらない』といった過度な期待を持っている場合は、常識的なクラウドの実態を把握させる必要がある。自社ビジネスのクラウドへの依存の程度、クラウドがどの程度止まっているかなどのクラウドの実状とビジネスとの関連、影響などのリアルな情報を生きた知識として提供することが重要」と述べる。
その上で、クラウドの障害規模は多くが小規模で、局地的かつ短期的なため、これらの障害に焦点を合わせた施策として、複数の障害ドメインを利用したサービスの冗長化、複数のアベイラビリティーゾーンを利用した高可用性、リージョンをまたいだサービスの冗長化などによる継続的な可用性の実現を検討すべきだとしている。