データを活用する取り組みは、日々進歩している。本資料は、奈良先端科学技術大学院大学が行った「クラウドソーシング+機械学習+大容量メモリサーバ」という興味深い取り組みの解説だ。
同大学が進めていたのは、「多元的ビッグデータ解析」のモデル構築だ。多元的とは、我々が扱う多種多様なビッグデータを、さらに有機的に組み合わせて有効な価値を得ようという概念。例えばセンサー、ソーシャルネットワーク、ライフログなど複数のビッグデータを組み合わせるもので、京都府とのプロジェクトでは、10万以上のツイート中から京都観光に関係のあるツイートだけを分類するテストを実施した。
そこで重要な役割を果たしたのが、のべ5000人以上が参加したクラウドソーシング(人力による評価)と、そのデータを徹底的に機械学習で取り込んでいく新たな分類モデルだ。
実行基盤に求められたのは、とにかく強力なメモリ性能(高速性、大容量)である。そこで選定されたのは「最大搭載メモリ4TB」を誇るパワフルな、かつリーズナブルなサーバだ。もちろんプロセッサ性能も吟味したがとにかくメモリ性能にこだわったことが、最終的に成功のカギとなったようだ。
ぜひ全文は、ダウンロードしてご覧下さい。
ホワイトペーパー