その中間となるSingularityには“Semi-Structured”つまり“準構造化データ”とも言えるものを格納している。たとえば、サイト上でのユーザーのIPアドレスや訪問時間、クライアントソフトなどを記録したログを準構造化データとしてSingularityに格納している。
Hadoopと既存のデータウェアハウスは相互補完
イベント3日目となる10月26日に開かれたメディア向けパネルディスカッションにRatzesberger氏が参加している。パネルディスカッションの中でRatzesberger氏は、Teradata製品とHadoopベースのデータ基盤の関係性について「どちらにも一長一短があり、相互補完の関係にある」と説明する。
「Hadoopはバッチ処理に使うことができる。柔軟性に優れているが、ガバナンスが大変だ。その一方でTeradataのようなエンタープライズデータウェアハウスは同時に利用するユーザーの数が多いというメリットがある」(Ratzesberger氏)
Ratzesberger氏はこう述べ、Hadoopと既存のデータウェアハウスは、適材適所で活用するべきだと主張している。