HadoopとRDBMSを適材適所で活用するeBay
eBayは世界最大のオークション企業である。日本ではヤフオクが先行者利益を勝ち取ったためマイナーな存在に見えるが、9000万人以上のアクティブユーザーをサポートし、1日当たり40テラバイトの新規データを獲得しているまさに「ビッグデータ」企業だ。
Amazonと対照的にeBayは、自社の社内ITに関する情報の公開に積極的だ。
同社は、並列RDBMSのTeradata上で実データ量25ペタバイトという世界最大のデータウェアハウスを運用している。その主な内容はクリックストリームだ。そのデータ量は40ペタバイトにも及ぶ(これとは別に6ペタバイト級のエンタープライズデータウェアハウスも存在する)。
非構造化データである(より正確に言えば準構造化データである)クリックストリーム分析をRDBMSで行なうケースは珍しいと思われるが、多くのユーザーによるアドホックな分析をサポートするための選択であるようだ。そして、オークションへの出品物のイメージや説明文などの非構造化データの分析にはHadoopを使用し、分析結果をRDBMSのデータウェアハウスにフィードする設計を取っている。
構造化データと準構造化データを実績あるRDBMSで、非構造化データをHadoopで処理し、両者を連携させていくという方式は、一般企業においても参考にできる「ビッグデータ」テクノロジの活用方法ではないかと思われる。
eBayは、少なくとも今のところは顧客に対して自社のクラウド基盤を提供するというビジネスには進出していない。もちろん技術的には十分実行能力はあるはずだがビジネスモデルとしての「選択と集中」を考慮すれば、少なくとも当面はオークションや決済系サービスにフォーカスすべきとの判断があるのだろう。コア領域外のビジネスであるSkypeでさしたる成果を出せなかったことの反省もあるかもしれない。
関連記事
Teradataの「ビッグデータ」戦略とeBay
eBay幹部が「eBayでのエクストリームアナリティクス」をテーマに講演
Hadoopのサポートへ方向転換したMicrosoft
Microsoftは将来への賭けとしてクラウドに注力しており、当然ながら「ビッグデータ」も同社の重要なアジェンダになっている。
同社はHadoop対抗技術としてDryadと呼ばれるプロジェクト(後にLinq to HPCに改称)を進めていたが、結局のところプロジェクトはキャンセルされ、(AzureにおいてもWindows Serverにおいても)Hadoopを採用する方へ方向転換したようだ。DryadはHadoopと比較してより複雑な並列処理が可能であるなどの特徴があったが、Hadoopの周辺に強力なエコシステムが形成されつつある中で自己流を貫くことは得策とは思えないので、これは賢明な撤退であったと言えよう。
一般的に言ってMicrosoftの最大の強みはその(Software as a Serviceならぬ)Software+Service戦略にある。同じプラットフォームを、クラウドでもオンプレミスでも利用できるということだ。ユーザーは自社に適合した場所でアプリケーションを稼働できるし、システムのライフサイクルの途中で切り替えることもできる。クラウドで試行して効果を上げられそうなことがわかった段階でオンプレミスに切り替えたり、あるいはオンプレミスで開始したシステムの処理能力が不足した場合にクラウドに移行することが、最小限の負担で可能になる。
「ビッグデータ」の領域においては前述の大量データの移行の課題はあるものの、多くの一般的企業にとっては現実的な戦略だろう。
Keep up with ZDNet Japan
ZDNet JapanはFacebookページ、Twitter、RSS、Newsletter(メールマガジン)でも情報を配信しています。現在閲覧中の記事は、画面下部の「Meebo Bar」を通じてソーシャルメディアで共有できます。