米国時間9月1日に発生したGoogleの約2時間にわたる「Gmail」の障害は、同システムの許容量を誤算していたためであるという。同社が1日遅くに明らかにした。
Gmailは太平洋夏時間9月1日午後12時30分頃から同午後2時30分頃までダウンした。これにより、多くのGmailユーザーが影響を受けた。
Googleによると、この障害はメンテナンスのため、複数のGmailサーバをオフラインにしたことで始まった。こうした定期的な作業は通常、ユーザーに気づかれることはない。しかし、Googleは、信頼性の向上を狙い、今回のメンテナンスでGmailのトラフィックをサーバに誘導するルータにいくつかの変更を加えた。そして、それが裏目に出てしまった。
Googleは1日遅く、Gmailブログで「われわれは、いくつかの最近の変更によって、リクエストルータにかかる負荷をいささか過小評価していた(皮肉なことに、変更のいくつかはサービス可用性を向上するためのものだった)。リクエストルータは、応答するためにウェブクエリを適切なGmailサーバに誘導するサーバだ」と述べた。
エンジニアリング担当バイスプレジデント兼サイト信頼性の責任者であるBen Treynor氏は、「太平洋夏時間9月1日午後12時30分頃に、いくつかのリクエストルータがオーバーロードを起こし始め、『トラフィックを止めてくれ、重くなりすぎている』とそのほかのシステムに伝えた。これにより、まわりのシステムの一部にもオーバーロードが発生し始めた。それから数分でほぼすべてのリクエストルータがオーバーロードになってしまった」と述べている。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。原文へ