Hadoopの活用に取り組んでいる3社の担当者に、ビッグデータという観点からITインフラを語ってもらう本座談会。前編「ビッグデータは新しい付加価値を生み出す」では、Hadoopの導入状況や各企業の取り組みについて議論を進めた。
Hadoopに対するニーズや、その活用メリットを考える上では、「ビッグデータ」というものが何かということをもう少し掘り下げてみる必要がありそうだ。
参加者
- 石川信行氏(リクルート MIT United システム基盤推進室)
- 濱野賢一朗氏(NTTデータ 基盤システム事業本部)
- 山口俊朗氏(日立製作所 情報・通信システム社 ソフトウェア事業部)
- 冨田秀継(司会、朝日インタラクティブ ZDNet Japan編集長)
そもそも「ビッグデータ」とは何か
冨田:「ビッグデータ」という用語が広まる前は、「情報爆発」ということが盛んに言われていました。両者の違いは何なのですかね。この2つが抱える課題に違いがあるとすれば、Hadoopが期待を集める理由も見えてくる気がするんですが。
濱野:包含関係ですかね。「ビッグデータ」には「情報爆発」という意味も含まれると思います。
情報爆発というと、単に大量のデータがあるというイメージです。しかし、ビッグデータは、それを高速処理することまで含めたニュアンスと捉えています。先ほど言った、データの容量か件数かという2種類のニーズで考えるならば、テレコムサービスのような大容量のデータ処理は「情報爆発」の流れを汲むシステムになりますね。一方でバッチ処理の代替として多くの件数のデータを処理するようなニーズは、ビッグデータになって新たに出てきたことだと思います。
山口:付け加えると、ビッグデータは、これまで扱っていなかったデータまで扱えるようになったイメージがありますね。
今まで貯めることができなかったデータや、もし貯めたとしても使い道がなかったデータがたくさんあるわけです。そういうデータを活用できるようになったことで、新しい価値を作ることができるようになった。
冨田:使い道がなかったデータを活用して、新しい価値を創出する――具体的にはどういった試みがあるんでしょうか。