Microsoft Azureの東日本リージョンで障害、原因は「電源設備の不具合」

ZDNET Japan Staff

2017-04-03 17:40

 クラウドサービス「Microsoft Azure」の東日本リージョンで、3月31日夜から4月1日朝にかけて仮想マシンが利用できなくなるなどの障害が発生した。同社は3日、電源供給システムの不具合が原因だとする調査報告を発表した。

 同社によると、障害は日本時間3月31日午後10時28分から4月1日午前7時16分にかけて発生。仮想マシンが利用できなかったり、再起動できなかったりするほか、パフォーマンスの低下やストレージサービスに依存するリソースへのアクセスの失敗といった問題が生じた。

 調査から障害の原因は、N+2の冗長構成となっている電源供給システムであることが判明。RUPS(rotary uninterruptible power supply)と呼ばれる方式の機器で障害が発生し、冷却システムに電源が供給されなくなった。これによって正常に冷却されなくなり、データセンター内の温度が上昇。ハードウェア側がデータの損失を防ぐために、自動的にシャットダウンされたという。

 Microsoftは、3月31日午後11時過ぎからファシリティ担当の委託先と手作業で復旧を図り、障害の原因になったとみられるシステムのユニットを分離した。冷却システムもN+1の冗長構成だったが、電源供給システムが冷却システムに影響した詳しい原因は調査中だとしている。

 同社は利用者へ謝罪するとともに、影響を受けたAzureサービスを見直して、今回のような現象が発生したとしても最小限のサービス中断となるように対策を講じるとした。また、障害の原因となった設備は提供元で調査し、再発のリスクを排除するという。

 なお、西日本リージョンは稼働しており、利用者がアプリケーションを「ジオ冗長性」としているケースでは障害による影響を最小限にできたと説明している。


Azure東日本リージョンで障害が発生した

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

自社にとって最大のセキュリティ脅威は何ですか

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]