前回、競争優位性を実現するためのアナリティクスの成功要因として、最先端テクノロジの取り込み、アナリティクスのアセット化という2つについて解説した。
今回は、「データの可視化」についての動向から、本題である分析結果の見える化、意味合い抽出について解説したい。また最後にOSSでのデータの可視化の例についてご紹介する。
データの可視化の動向
データの見える化とは、データという情報を収集・加工・集計し、それを文字や線がきの絵などを使って表現することと言える。インフォーメーション・グラフィックスや、単にチャートやグラフとも呼ばれている。
ビッグデータについては、2011年の震災時に得られた数十万人の行動記録や車の走行記録データを可視化することにより、当時何が起こっていたのかを直感的にあぶり出し、現在の震災対応策に反映されている。
学術的にもデザインの世界でも、コンピューターの性能向上に伴い、データをいかに可視化するかという取り組みが本格化し、1995年からIEEE Information Visualizationグループが活動を開始している。特に近年、ビジュアル・デザインの観点からも、インフォメーション・グラフィクス関連の書籍が多く出版されている。
エンジニア向けには、『エンジニアのためのデータ可視化「実践」入門』(著:森藤大地・あんちべ、技術評論社)は、データの可視化自体を体系的に整理し、具体的なプログラミング事例まで解説されているので、興味のある方は、ご参照されたい。
レポーティングとアナリティクスの違い
「分析結果の見える化」については、これまで定型分析と言われるレポーティング用のソフトウエアで、ビジネス・インテリジェンス(BIツールと呼ばれることが多い)という分野がある。昨今は、アナリティクスの隆盛により分析機能を付加したものや、インフォメーション・グラフィックの進化により、デザイン性の優れたグラフやチャートを表示できるものが登場している。
例えば、操作性とデザイン性に優れたツールを提供するベンダー(QlikView/MicroStrategy/TIBCO Spotfire/Tableau/YellowFin)から、統計分析ソフトから進化した統合分析環境を提供するベンダー(SPSS/SAS)も存在する。データ取込からレポート作成まで直感的な操作性で、ユーザーがセルフサービスで出来るように機能を強化しているようだ。
レポーティングは、決まった手順でデータを加工・集計し、決められたフォーマットに編集して出力することであり、レポーティングという行為は、定型検索とも呼ばれている。
一方、アナリティクスは、課題解決のために、必要なデータの選定・収集から加工・整理、モデル構築、検証までを非定型的に行うことであり、データの見方を変えたり、データを統合・加工しながら、データを観察していく。アナリティクスにおける行為の大半は、非定型検索が占める。
昨今、レポーティングとアナリティクスが混同されていることが見受けられることもあるが、アナリティクスとレポーティングの違いと、それを使うユーザーのスキルを加味した上で、目的によってツールを使い分けなければならない。
図:ツールとユーザースキル
アナリティクスにおける分析担当者のスキルは、パワーユーザー以上を想定しており、簡単なプログラミング言語やマークアップ言語について、「スキルがある」もしくは「スキルを習得可能」である必要がある。
OSSの進化とともに、コーディングのしやすさとデータ可視化のテクノロジーが進み、ちょっとしたコーディングを覚えれば、さまざまなグラフやチャートをインタラクティブに表現できる技術(HTML5/CSS/JavaScriptを中心に多数のライブラリがある)が発達してきており、デザイン性に優れたグラフをウェブ上で表示できるようになっている。
OSSでは、RやIPythonのグラフ化機能に加えて、ウェブ上でインタラクティブな動作を構築できるJavaScriptのライブラリ「D3.js」が主流となってきている。またRにUIやワークフローを追加したパッケージも登場している(RapidMiner/Exploratory)。
BIツールも同様に進化しているが、使いこなすにはデータの理解が最小限必要であるし、だれにでも操作できるように作られたUIは、慣れてくると逆にまどろこしく、帯に短し襷に長しである。アナリティクスの担当者にとっては、ちょっとしたITリテラシがあれば、OSSを利用することにより、最新技術やツールを操ることができる。またOSSは低コストである。