Googleは人工知能の手法を採用して、世界中に設置されたデータセンターから最大限の効率を引き出そうとしている。
ニューラルネットワークを利用することで、同社のオンラインサービスを支える施設で電力の浪費を抑える方法を学んでいるのだ。
ニューラルネットワークは、過去の購入履歴に基づいて消費者に製品を勧めるのに利用されることが多い。脳のさまざまな側面、具体的にはニューロン間の相互作用を模倣することを目指す機械学習アルゴリズムの一種だ。
3層のニューラルネットワーク
提供:Google
Googleのメカニカルエンジニア兼データアナリストであるJim Gao氏は、オンラインに掲載した論文に次のように記している。「機械学習アルゴリズムを既存の監視データに応用することで、データセンターの運用効率を大幅に高める機会を得られる」
「一般的な大規模データセンターでは、多数のセンサで膨大な数のデータポイントが毎日生成されているが、このデータが監視目的以外の用途に利用されることはほとんどない。処理能力と監視機能の進歩によって、機械学習がベストプラクティスを先導し、データセンターの効率を高める大きな機会が生まれている」
報道によると、ニューラルネットワークを使うアイデアを思いついたのは、Googleのデータセンター責任者であるJoe Kava氏だという。Kava氏は以前、スタンフォード大学が提供する機械学習のオンラインクラスを受講していた。
ニューラルネットワークに目を向けるきっかけとなったのは、データセンターの効率を高める取り組みの効果が減少していたことだ。
データセンターの電力使用効率(Power Usage Effectiveness:PUE)には、施設が使用する電力のうち、どれだけがサーバの稼働に使われているかが反映される。冷却や電力配分を扱う関連インフラストラクチャに使われる電力は含まれない。
近年、FacebookやGoogleといった大手テクノロジ企業は、熱の封じ込めや水の効率利用、広範な監視などの手法を使って、PUEの理想値である1.0の達成に徐々に近づいている。
しかし、PUEが1.0に近づくにつれて、施設の効率向上のペースは低下してきた。GoogleのPUEの変遷を示すこのグラフを見ると、2008年には1.21だった同社の全データセンターの年間平均PUEが、2013年には1.12に改善されていることが分かる。
画像提供:Google
Googleによると、ニューラルネットワークに取り組むのは、「PUEが1.10を切った時代にデータセンターパフォーマンスを最適化するデータ主導型アプローチの効果を実証する」ためだという。
なぜニューラルネットワークなのか?
大規模データセンターのさまざまな機械設備や電気設備は大量のデータを生成するうえ、こうした設備の間のやりとりも複雑であるため、従来のエンジニアリング手法でデータセンターの効率を予測するのは難しい。
Googleは、施設にわずかな変更を加えただけで、接続されたシステムすべてに影響が及ぶ可能性があるという例を示している。