Hadoopの活用に取り組む3社の担当者に、ビッグデータという観点からITインフラを語ってもらう本座談会。前編と中編では、Hadoopの導入状況にはじまり、ビッグデータとは何か、なぜそれが必要とされるのかなどを議論した。
「ビッグデータ」と言った場合、単にデータを蓄積するだけではなく、それを高速に処理できるという意味が含まれるのではないか。その高速処理の一例として、大量データを元にした分析による、新たなビジネス価値の創出が挙げられた。
では、実際にHadoopで新たな価値を創出しようとした場合、気をつけるべき点は何だろうか。また、具体的にどのようなシステム構成で導入されているのだろうか。リレーショナルデータベース(RDB)やデータウェアハウス(DWH)との関係も含めて議論した。
これまでのビッグデータ座談会
座談会参加者
- 石川信行氏(株式会社リクルート MIT United システム基盤推進室)
- 濱野賢一朗氏(株式会社NTTデータ 基盤システム事業本部)
- 山口俊朗氏(株式会社日立製作所 情報・通信システム社 ソフトウェア事業部)
- 冨田秀継(司会、朝日インタラクティブ株式会社 ZDNet Japan編集長)
Hadoop+RDB、Hadoop+DWHという選択肢
冨田:Hadoopの導入や運用について話しましょう。OSS(オープンソースソフトウェア)ゆえの難しさは、やはりありますか。
山口:サポートの付かないOSSでは当たり前のことかもしれませんが、バージョンアップの際の互換性の確認や、必要な設定の変更など、自分達ですべて把握する必要があります。
かといって、古いバージョンはバグ修正のサポート対象外になっていたりすると、バージョンアップしないで放置するわけにもいきません。そういう面での大変さはありますね。日立の場合は、Hadoopのノウハウを蓄積して顧客をサポートする部門を作って対応しています。
濱野:我々の場合、SIerだからという面もあると思いますけど、OSSだからという理由で困ることはあまりないですね。ただ、開発が進むのを待っていたのでは顧客への対応が間に合わないケースもあるので、Hadoopの開発コミュニティに対してどう貢献していくかという部分も含めて、総合的にやっていくという姿勢をとっています。
石川:うちの場合、まさにバージョンアップで困った経験があるんです(笑)OSSであることと、それからアメリカ発であることから、まだ使えるユーザーが(国内で)少ないという問題があります。日本語のドキュメントも多くはないですし、商用製品に比べればやはりハードルは高いと思います。
冨田:それでもHadoopを選択したわけですよね。Hadoopの他にはどういったプロダクトを検討したんですか。