近年のITインフラにとって、ビッグデータの取扱いは極めて深刻な課題とされている。ビッグデータを迅速かつリアルタイムに処理することは、インターネット上に氾濫する情報のビジネスへの活用に直結するからだ。
そこで注目されているのが大量かつ大容量のデータに対応した分散処理技術である。特にこの分野を牽引している「Hadoop」への期待は大きい。
そこで今回、Hadoopへの取り組みを進めている3社に集まってもらった。導入を進めている企業の代表としてリクルート、システム開発事業に取り入れようとするNTTデータ、アセスメントサービスなどを提供する日立製作所の3社だ。
それぞれ立場が異なるものの、「ビッグデータ」という課題から見たIT業界の現状や、Hadoopをはじめとした大量データ処理技術の導入状況、今後の展望などについて語った。なお、座談会の司会はZDNet Japan編集長の冨田秀継が担当した。
Hadoopへのかかわりは三者三様
「リクルートでHadoopの検証と導入を担当しています。リクルートでは数年前より、大規模データ処理を行うにあたって最適なツールは何かという検討を進めてきました」
そう語るのは、リクルート MIT United システム基盤推進室 インフラソリューショングループの石川信行氏だ。Hadoopについては、「2010年の秋ころから検証をはじめました」という。
NTTデータからは、基盤システム事業本部 システム基盤サービスビジネスユニット OSSプロフェッショナルサービス シニアエキスパートの濱野賢一朗氏が参加。同社は、“ビッグデータ”が課題として浮かび上がる前、2008年からHadoopに取り組んできたという。
「私(濱野氏)自身は本来はエンジニアなんですが、最近ではビジネス開発などにも関わっていて、もう少し技術面に専念したいというもどかしい気持ちも少しあります(笑)ただ、Hadoopそのもの使われ方や、ビッグデータの価値を見出すことなども面白いと感じているので、その関連でHadoopの勉強会やユーザー会のコーディネートなどもやっています」
ベンダーの代表として参加したのは、日立製作所 情報・通信システム社 ソフトウェア事業部 大量データ処理ビジネス推進室 担当部長の山口俊朗氏だ。
「私(山口氏)は日立に入社して、ずっと開発の現場で仕事をしてきました。入社当初はメインフレームの開発、それからクライアント/サーバの時代がきて、今は大量データ処理のソリューションを担当しています。この中にはHadoopも含まれるわけですけど、Hadoopだけではなくて他にも様々なソリューションを扱っています。例えば日立ではバッチの分散処理を行う『グリッドバッチ』という、言ってみれば基幹系に特化したHadoopのようなソリューションも持っているのですが、そういったものも使います。重要なのは顧客の悩みを聞いた上で何を選択するかということで、その選択肢の中にHadoopがあるという感じですね」