「ビッグデータとクラウド・ストレージ」 連載 第六回
トレンド編3: オバマの「マネーボール」作戦とAWS
本ブログはクラウディアンのブログでも読むことができます。 (»リンク)
CloudianのFacebookページに「いいね!」で最新情報をお知らせします。 (»リンク)
エノテック・コンサルティング代表
海部美知
◆ 大統領選を制したビッグデータ
11月のアメリカ大統領選では、民主党オバマ大統領側がITとネットによる情報収集力をフル活用し、接戦と伝えられた選挙戦を制する原動力となったともっぱらの評判だ。
2008年の選挙の時は、どちらかというと「有権者にリーチする新しい手段」として、フェースブック・ツイッター・ユーチューブ・スマートフォンなどを、「情報を配信する線」として活用することが中心だった。これに対し、今回の選挙ではソーシャルによる情報配信はもはや当たり前で、それよりも「情報収集・解析・予測・絞り込み」、つまり「線」ではなく「脳」の部分にビッグデータ手法を活用し、もっと高度な使い方をした。
・資金集め: 過去の支持者データベースや外部データを活用し、寄付する可能性の高い人のリストを作り、寄付を呼びかけたり、対象の年令・性別・土地柄に合わせて資金集めパーティの目玉セレブを選択し、カリフォルニアではジョージ・クルーニーを招いて大成功を収めたなどが知られる。
・投票の呼びかけ: 膨大なシミュレーションに基づき、それぞれのターゲットに合わせた発信者と内容のメッセージが送られた。たまたま私の手元には、ミシェル・オバマ夫人から「投票に行きましょう」というツイッターのダイレクトメッセージ が届いた。ちなみに対抗するロムニー候補からは、2500ドルの寄付を依頼する紙の手紙が来た。ロムニー氏の場合は、おそらく、大学の名簿から私の名前と住所を引っ張ったと思われるが、この対照に思わず笑ってしまった。
・テレビCMや遊説: 伝統的な選挙運動についても、どの場所でどのような演説をするか、支持してくれそうな視聴者層にリーチするにはどの番組にどんな広告を出すか、といったことも細かくデータ解析ではじき出した。
◆ ケチケチ勝つ「マネーボール」作戦を支えたAWS
こうした戦法は、「データ解析を駆使して小が大に勝つ」の代名詞となった例の映画にちなんで「マネーボール」作戦ともよばれる。
ARS Technicas誌記事 (»リンク) によると、人件費まで含めたキャンペーン中のITへの支出額は、オバマ陣営はロムニー陣営の2/3に過ぎなかったという。オバマ陣営は、前回の選挙以来バラバラだった数多くの支持者リストを統合し、外部のデータも活用し、膨大なデータを扱い膨大な回数の演算をしながらも、無料のオープンソース・ソフトを徹底的に使い倒してコストは最小限に抑えた。
そんなケチケチ作戦を支えたインフラが、アマゾン・ウェブ・サービス(AWS)だった。チームがつくったソフトウェアは99.99%AWSでホストされ、コストを下げサーバー管理の手間を省いた。アマゾンにホストされたアプリケーションの数は200以上、しかしアマゾンへの支払額は$257,287.97で、大規模な運用の割に少ない。(キャンペーン中の経費明細が記事の中で詳細に公開 (»リンク) されている。)そして、選挙の直前にトラフィックが極端に上がり、終わったらほとんどを撤去するという使い方にAWSは最適、というよりAWSがなければほぼ不可能とすら言えるだろう。
AWSに関するブログ (»リンク) では、キャンペーン中に支援依頼の電話をかけるための管理ツールの例が示されている。同時に利用するユーザー数は7000人、投票日直前に電話件数が急激に増え、最後の4日間だけで200万本の電話をかけたが、このためのツールがAWSでホストされた。この間突然データ量が増え、選挙が終わればゼロとなる。
S3(Simple Storage Service)は、さまざまなクラウド・サービスから成るAWSの一つの構成要素であり、サーバー障害に備えたバックアップにも利用された。ウェブサイトのスナップショットを定期的にとり、S3に保存しておいて、障害があれば最新のスナップショットにリダイレクトされる。投票日の前にハリケーン・サンディが東海岸を襲ったのは、ちょうどよい予行演習になったとのことだ。
◆ 企業にも活用されるAWS・S3
このように、アマゾンAWSおよびS3は、ウェブサービスだけでなく、政府や企業にも使われるようになっている。
オバマ選挙運動のビッグデータ・チームは、11月末に開催されたアマゾンの開発者会議re:Inventに登場した。私は参加できなかったが、見るからにナントカな人々 (»リンク) である。
このre:Inventでの講演で、ポリシー・ベースのアーカイブサービス (»リンク) が紹介されている。企業の基幹系システムの場合、アクセス頻度の高い「Tier1」データは高速でアクセスできるSANに保存、その後一定の期間が過ぎるなど、なんらかのポリシーに基づき「Tier2」に移され、さらにその後ディスクやテープに落として倉庫に保管となる。高速アクセスのできるストレージほど高価だからだ。これが最近では、Tier2にS3を利用し、さらに数時間後に取り出せればよいという、ディスク・テープの代わりとなるGlacierというサービスも提供されている。
re: Inventは今回が初回であったが、ZDNet (»リンク) によると、参加者6000人という盛況だったようだ。この会議での報告によると、現在AWSは190地域に数千の顧客を持ち、S3のオブジェクト数は今年6月の1兆個からすでに1.3兆個に達し、一秒あたり83.5万件のリクエストを処理し、370万のクラスタを持つという。2011年に81件であった新サービス・機能は2012年では158件に増加、一日に50億ドル級の世界企業一社分の容量を増やし続けている。
一方で、今年にはいってすでに23回の値下げをしてきたが、今回24回目の値下げを発表した。グーグルとの競争などがその背景にある。
こうしたパワーに支えられ、S3は高い堅牢性と無制限の容量を提供し、政府や企業のITシステムにも浸透しつつある。従来、企業の基幹システムでは、安全性への懸念などから、クラウドの利用は必ずしも進んでいなかったが、最近は用途により、パブリック・クラウドやプライベート・クラウドを使い分けるメリットが認識されてきた。
オバマのマネーボール作戦のように、クラウドに適した用途にうまく安価なパブリック・クラウドを活用することで、企業のサーバーやストレージのコストを大幅に下げ、競争に勝ち抜き、より高いマージンを確保することが、今後ますます重要になっていくだろう。
- 海部 美知(かいふ・みち)
- 海部 美知エノテック・コンサルティングCEO(最高経営責任者)。ホンダを経て1989年NTT入社。米国の現地法人で事業開発を担当。96年米ベンチャー企業のネクストウエーブで携帯電話事業に携わる。98年に独立し、コンサルティング業務を開始。米国と日本の通信・IT(情報技術)・新 技術に関する調査・戦略提案・提携斡旋などを手がける。シリコンバレー在住。子育て中の主婦でもある。
ブログ:Tech Mom from Silicon Valley。
Twitter ID:@MichiKaifu。
著書に『パラダイス鎖国 忘れられた大国・日本』(アスキー
新書)がある。