編集部からのお知らせ
「半導体動向」記事まとめ
「リスキリング」に関する記事まとめ

AWS S3の大規模障害、原因は入力ミス--調査レポート公開

Stephanie Condon (Special to ZDNet.com) 翻訳校正: 編集部

2017-03-03 10:46

 Amazon Web Services(AWS)は米国時間3月2日、同社のサービスで2月28日に発生した大規模システム障害に関する調査レポートを公開した。クラウドストレージサービス「Amazon Simple Storage Service」(Amazon S3)を利用する数多くの顧客のサービスが数時間にわたって影響を受けたこの障害の原因は、入力ミスだったという。

 AWSは同レポートで以下のように説明している。

 Amazon S3チームは、S3の課金システムの動作が遅いという問題の原因を修正しようとしていた。太平洋標準時間午前9時37分、権限を有するS3チームメンバーの1人が、S3の課金プロセスによって使用されている、あるS3サブシステム用のサーバのごく一部を切り離すために、確立された手順に従ってあるコマンドを発行した。残念なことに、このコマンドに引き渡す入力の1つが誤っており、想定していたよりも多くのサーバを切り離してしまった。

 このミスによって、US-EAST-1(米国東部:バージニア北部)リージョン(Amazonで最も古くから稼働しており、数多くのデータセンターを抱えるリージョン)におけるすべてのS3オブジェクトが必要とする2つのサブシステムが意図せず停止した。いずれのシステムも完全な再起動が必要となった。再起動と、安全面で必要なチェックの実施に「予想以上の時間がかかった」とAWSはレポートに記している。

 これらサブシステムの再起動中、S3はサービス要求を処理できなかった。また同リージョンで、ストレージとしてS3を使用しているその他のAWSサービスにも影響が及んだ。影響を受けたなかには「Amazon S3コンソール」や、「Amazon Elastic Compute Cloud」(Amazon EC2)の新規インスタンスのローンチ、「Amazon Elastic Block Store」(Amazon EBS)のボリューム(Amazon S3のスナップショットからデータが必要となった場合)、「AWS Lambda」が含まれている。

 AWSによると、インデックスサブシステムは太平洋標準時間午後1時18分に完全に復旧し、プレイスメントサブシステムは同午後1時54分に復旧したという。この時点までに、S3は通常稼働に戻っていた。

 AWSは今回の障害発生を教訓として、こういった問題を引き起こすような誤った入力を防ぐための措置も含め、ツールの修正など「複数の変更」を実施するとしている。AWSはこの他にも、インデックスサブシステムをより小さな単位に分割するという対策に向けた作業に着手している。またAWSは、「AWS Service Health Dashboard」の管理コンソールに変更を加え、AWSの複数リージョンをまたがって稼働するようにもした。2月28日の障害ではダッシュボードにも影響が及んだため、AWSは問題に関する情報を顧客に随時伝えるためにTwitterを利用しなければならなかった。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. 開発

    なぜ、コンテナー技術を使うことで、ビジネスチャンスを逃さないアプリ開発が可能になるのか?

  2. セキュリティ

    2022年、セキュリティトレンドと最新テクノロジーについて、リーダーが知っておくべきこと

  3. ビジネスアプリケーション

    全国1,800人のアンケートから見えてきた、日本企業におけるデータ活用の現実と課題に迫る

  4. 運用管理

    データドリブン企業への変革を支える4要素と「AI・データ活用の民主化」に欠かせないテクノロジー

  5. 経営

    テレワーク化が浮き彫りにしたリソース管理の重要性、JALのPCセットアップを支えたソフトウエア

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]