Hadoopの導入状況は他のオープンソースと異なっている
冨田:最初に、現状ではどれくらいのユーザーがHadoopにコミットしているのかを聞きたいと思います。
濱野:あくまで個人的な実感ですが、イベントの参加者層などを見る限り、興味を持っている人は非常に多いと思います。ただし内訳を見てみると、そのうちの半分くらいはこの業界(IT業界)の人で、ユーザー企業は残りの半分くらいですね。実際に導入しているということであれば、さらにその2割くらいの割合になると思います。
冨田:特に導入が進んでいる業種の傾向などはありますか。
濱野:ユーザー企業の中でも、特に導入が進んでいるのはウェブサービス系の企業と、大規模システムを持ったエンタープライズ系の大企業ですね。その中間の企業では、まだ検討段階という感じです。
オープンソースというとまずウェブ系の企業が使い始めて、最後にエンタープライズ分野に広まっていくというケースが多いのですが、Hadoopの場合はちょっと違っていて、両極端の分野での導入が同時に進んでいるという傾向があります。
この背景は、「ビッグデータとは何か?」を突き詰めて考えていけば、もっと見えてくるんじゃないかと思っています。ひとことにビッグデータと言っても、データの容量が大きいのか、それとも件数が多いのかという2つのケースがあって、同じように見えても実はシステム的には大きく事情が違うんです。
冨田:石川さん、リクルートはどちらのケースにあたるんでしょうか。
石川:どちらのケースもありますね。リクルートの場合、いろんなサービスを持っているということと、同じサービスでも利用する切り口によってデータの形が変わってくるので、どちらか一方という感じではありません。
冨田:山口さん、日立が手がける案件ではどうですか。
山口:うちでも両方のケースがあります。基幹系のニーズを考えてみると、今までは大量のデータがある場合には夜間バッチで処理し、その結果を見るという流れだったので、“データを貯める”ことが必要でした。
それを貯めないで、もっと鮮度のいい情報が得られるとしたら、新しいことに使えるんじゃないか、と。そういう期待があったところに、Hadoopは最初から比較的完成度の高いシステムとして登場し、海外での事例もあったので、トップダウンの導入につながっているんじゃないかと思います。