Microsoftは、新型コロナウイルスの世界的な感染拡大が始まって以降、クラウドのキャパシティを増強するための取り組みに関する情報を順次公開してきた。しかし同社は、米国時間6月16日、それらの取り組みについて、さらに詳しい情報を明らかにした。同社はその中で、この春以降需要が急増している「Microsoft Teams」(同サービスはAzure上で動いている)のサービスを維持するために、どのような対応を行ってきたかについても説明している。
提供:Microsoft
同社はこれまでにも、新型コロナウイルスに対応する初期対応者や医療従事者、その他の第一線で働く人々の需要を優先していることを明らかにしたほか、重要性が低いとしてスロットリングしている一部のサービスについての詳細も公表している。また同社は、サプライチェーンの問題から、データセンターに必要なコンポーネントの一部が不足していることが原因で、クラウドの需要拡大に対応するのが困難になっていることも認めている。
今回の説明では、Microsoftのデータセンター担当者が、24時間体制のシフトで(十分な対人距離を確保しつつ)新規サーバーの導入作業を進めていることが明らかになった。同社は、もっとも影響が大きい地域から、連続作業で順次新しいサーバーを追加し、ハードウェアを収容するラックを設置しているという。
またMicrosoftは、大西洋をまたいでデータを運ぶ同社の海底ケーブルのうち1本の容量を2倍に増やし、「もう1本のほかのオーナーとの間で容量を融通してもらう交渉を行った」ほか、America Europe Connectの海底ケーブルで利用できる容量を2週間で3倍に増強したとしている。
同時に、各製品のチームがAzure上で動いているMicrosoftのサービスをすべて調べ、「Teams」や「Office」「Windows Virtual Desktop」「Azure Active Directory」の「Application Proxy」、「Xbox」などの需要が大きいサービスのためにキャパシティを開放した。エンジニアがコードを書き換えて効率を改善したケースもあり、例えば動画ストリームの処理は、ある週末に急いで作業を行ったことで、効率が10倍になったと同社は述べている。
Teamsには、予約されているキャパシティをさらなるデータセンターリージョン間で展開できるように変更が加えられたが、同社は、通常であれば何カ月かかけて行うこのプロセスを1週間で終えた。それに加えて、Azure Wide Area Networkチームは、同社のデータを運ぶ光ファイバーネットワークの容量を2カ月間で110テラビット増強し、ネットワークの輻輳を軽減するために、新たなエッジサイトを12カ所設けて、地域のインターネットサービスプロバイダーのインフラと接続した。
Microsoftはまた、地域によって異なる需要のピークを分散させるために、Azureの内部でワークロードを振り分け、需要が大きいリージョンのトラフィックを分散させた。コンシューマー向け事業でも、ゲームのワークロードを需要が大きい英国やアジアのデータセンターからほかの地域に移し、ピーク時の帯域使用量を抑えた。
さらにMicrosoftは、新型コロナウイルスによってクラウド需要が増大したことで、予測モデルを修正する必要に迫られた。同社は、予測が過大になることを避けるために、それまで使用していた予測モデル(ARIMA、加法、乗法、対数)に簡単な国単位の上限値を追加した。また、業界ごと、地域ごとの利用量の変化や増大のパターンをモデルに取り込んでチューニングを行った。国別の新型コロナウイルスの影響に関する外部データもモデルに加えた。
同社は、「そのプロセスでは非常に慎重な姿勢を取り、できるだけ過剰にプロビジョニングすることを心がけ、その上でパターンが安定してきたら必要に応じて規模を縮小した」と述べている。