Amazon Web Services(AWS)の東京リージョンで8月23日に発生したElastic Compute Cloud(EC2)サービスの障害は、冷却システムの故障により高温化した一部のサーバーがシャットダウンされたことが原因だったという。同日午後9時までにEC2の大部分のサービスが復旧したとしている。
AWSによると、障害は東京リージョンの一部で使用している複数の冷却システムが故障したことで発生した。これによってEC2サービスのサーバー機器の温度が上昇し、サーバーがシャットダウンされたことで一部のインスタンスやEBSボリュームに影響が生じたとしている。
その後、冷却システムの復旧で温度が下がり、電力が安定化したことで、大部分のインスタンスやEBSボリュームが復旧したという。しかし、ハードウェア上にホストされていた少数のインスタンスやEBSボリュームは、電力の損失によって深刻な被害を受けた。同社では復旧作業に当たっているもの、対応を急ぐユーザーには他のインスタンスやEBSボリュームへの交換を推奨している。
なお、同じく障害が発生したRelational Database Service(RDS)についても大部分は復旧したが、引き続き残りの復旧作業を進めているという。
最新状況はAWSのService Health Dashboardで確認できる。
Update
AWSによれば、日本時間2019年8月23日午後10時過ぎにRDSも復旧し、現在は平常サービスに戻っている。