前回はマーケティング部門側の視点から、日々の分析に役立つ技術について解説した。今回は前後編に分けて、おもに主に情シス部門に向けて、エンジニアの視点からデータ分析において役立つさまざまな技術を紹介する。情シス部門側は分析チームにおいて、下記のような業務を担う可能性が高い。
- 集計処理の自動化
- 分析レポートの継続化
- データの収集
- 分析用データの蓄積
これらを実施する上で役立つ技術は、いったいどのようなものがあるのか。
集計処理の自動化・分析レポートの継続化
プログラミング言語「R」
プログラミング言語「R」は、集計処理の自動化や継続的にレポートを出力するための便利なツールだ。前回はマーケティング部門側の担当者がインタラクティブな分析に利用していたが、情シス側が用いるとすれば、主に定形処理のためのバッチ処理だろう。コンソールで実行した際のサンプルは次の図のようになる。
コンソールでの実行例
EmacsやVimなどのエディタを利用し、すべてコンソールのみでスクリプトを作成することも可能だが、コードの記述、デバッグ作業、プロジェクト管理などの負担を軽減するには統合開発環境「RStudio」を利用するとよい。
RStudio サンプル画像