Amazon Web Services(AWS)で12月に2週連続で障害が起こっていた中、3度目の障害が発生した。「Slack」や、位置情報共有アプリ「Life360」、「Grindr」、McDonald'sのアプリ、Epic Gamesのストア、「Fall Guys」のような人気のゲームなど、主要なアプリやサービスが影響を受けた。
障害は、米東海岸のSlackユーザーにとって最悪といえるタイミングで発生した。東部標準時午前7時少し前に障害報告が急増し始めた。多くのユーザーが1日の始まりにログインするタイミングだ。数分後にはAWSのステータスページが更新され、「『米国東部(バージニア北部、US-EAST-1)』リージョンで、単一のアベイラビリティーゾーン(「USE1-AZ4」)内のデータセンター内部」で停電が発生したと報告された。
この停電自体は比較的影響範囲が限られていたが、「Amazon Elastic Compute Cloud」(Amazon EC2)サービスに対する影響は短時間で極めて壊滅的なものとなった。
復旧作業は迅速に開始され、AWSは停電を検出した後、18分以内に電力復旧の進捗状況を公表した。しかし、作業はAWSが電力の完全復旧を報告した米東部時間午前9時51分まで数時間続いた。その後もサポートページでは、影響を受けたEC2インスタンスの一部で、ネットワーク接続面で問題が続いていると報告されている。また同社は、ストレージサービスの「Amazon Elastic Block Store」(Amazon EBS)を利用している一部の顧客も停電中に「I/O性能が低下」するなどの影響があったとしている。
12月に発生した3度の障害にはパターンがありそうだが、共通点はほとんどないようだ。12月7日に発生した最初の障害は今回と同様、US-EAST-1リージョンに影響を与えたものの、停電が原因ではなく、ネットワーク容量を自動的に拡大/縮小する機能の問題が原因だった。2度めの障害は、「米国西部(北カリフォルニア、US-WEST-1)」と「米国西部(オレゴン、US-WEST-2)」の両リージョン全域で発生し、ネットワーク接続面での問題に関連していた。
AWSの障害が急増したことについて、何らかの根本的理由があるのかどうか、あるいは単に不運が同社を立て続けに襲っただけなのかは分かっていない。しかし、AWSの安定性に依存するアプリやサービス、ゲーム、ウェブサイトは、今回のサービス停止をきっかけに、自社の収益に与える影響を厳しい目で慎重に検討し始める可能性もありそうだ。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。