ネット広告プラットフォームサービスを提供するマイクロアドは、新しいデータ分析基盤としてHadoopディストリビューション「Pivotal HD」とPivotal HDにSQLでアクセスできるオプション「HAWQ」を利用している。伊藤忠テクノソリューションズ(CTC)が3月18日に発表した。
マイクロアドはサイトの利用者が過去に閲覧したページなどの行動履歴データを解析し、広告主に最適なユーザーを探し出して広告を配信する行動ターゲティングを展開。直近のデータをデータウェアハウス(DWH)に格納、それ以外をHadoopに蓄積している。
これまで使っていた解析ツールの都合から行動履歴データの分析、閲覧は、主にDWHのデータを対象としており、Hadoopに蓄積しているデータの利活用は限定的だった。Hadoopで行っていた一部の分析も処理時間の長さが課題となっていたという。
Pivotal HDは、開発が進む「Apache Hadoop 2.0」がベース。一元的な構成管理、監視を実現する機能、仮想基盤上のHadoopを最適化する機能が追加されている。オプションのHAWQは、Pivotal HD上で稼働するANSI SQLに対応するデータベースエンジン。HadoopのデータにSQLでアクセスできる。
PivotalジャパンとCTCでは、Pivotal HDとHAWQを2013年11月から検証。マイクロアドは、この2月から稼働させている。Pivotal HDとHAWQの導入は国内で初という。Pivotal HDとHAWQを導入することで、マイクロアドが使っている分析パッケージを変更することなく、最大70倍程度の速さで分析できるという。
マイクロアドにとっては、データ分析範囲の拡大と分析に必要な時間の短縮で従来よりも多くの分析を試すことができるようになり、新たな商品やサービスの開発に取り組めるようになったと説明している。