トップインタビュー

従来比1000倍速のデータベースエンジンを開発する意味―NII喜連川所長 - (page 3)

大西高弘（NO BUDGET）山田竜司（編集部）

2014-10-09 12:25

300億ツイートの分析から見えてきたもの

　喜連川氏が研究者としてのテーマにしている「巨大データベースエンジン」が以前にも増して注目されるのは、昨今のビッグデータブームが影響していることは間違いない。

　しかし、ビッグデータといっても喜連川氏がFIRSTでの成果をベンチマークにかけたデータの大きさは、100Tバイトである。

　日立製作所によれば、大手コンビニエンスストアの販売時点情報管理（POS）データ7年分になるという。しかも喜連川氏にとって従来の100倍の性能を記録したことは通過点で、目標はあくまで1000倍の性能だ。一般の企業が扱うビッグデータとはケタが違うし、目指す結果がかなり遠いところにあることは間違いない。

　100倍ではなく、なぜ1000倍なのか。喜連川氏はNIIの機関誌などで「1000倍になれば世界が違ってくる」と語っている。未到達の1000倍の世界を考える上で、氏の研究室では、東日本大震災の発生直後からのツイートを集め、時系列で追いかけていた。

　量にして300億ツイート。これらのつぶやきが震災発生からどのようにして生成され拡散し、消滅してはまたうまれていったのかを追跡、分析していったのだ。

　「ツイートはブログなどでの発言と違い、瞬間に感じたことがテキストになって現れてきます。地震発生直後には、阪神淡路大震災や過去の大きな災害を被災経験者が、具体的なアドバイスをつぶやいたり、避難所情報を独自に集めてGoogleMapsに貼り付けて提供している人が現れ、それをフォロワーの多い人が拡散させるなどの行動が見られる。また、時系列の流れだけでなく、テキストを選択して分析することで『いま、何が必要なのか』が分かってくるのです」