前回は、組織における情報のサイロ化における課題とその解決方法を提起しました。共有すべき情報がサイロに陥らないように対策を講じた先に待っているのは、いよいよデータを活用し、ビジネスに貢献させていく段階です。
本連載でも盛んに主張しているように、さまざまなデータを1カ所に集め、それぞれのエンドユーザーがデータにアクセスしやすくなり、意思決定などにもアナリティクスを活用できるようになる一連の活動は「データの民主化(Data Democracy)」と呼ばれています。
データ民主化を実現することによって得られるメリットは、担当者(エンドユーザー)が組織における活動の履歴を適切に引き出し、それぞれの軸で仮説検証ができる点や、既存の組織内の暗黙知に隠れたデータの傾向などをうかがい知ることができる点があります。一方でデメリットにもなりかねない懸念点もあります。例えば、多くのエンドユーザーが気軽にアクセスできる分、分析のアウトプットの質が低下する懸念があります。民主化されたデータから分析を行うフローは例えば下記のような流れになります。
データ分析フロー
- 課題を特定する
- 課題を解決するためのデータを実際に抽出する
- クロス集計や多変量解析を実施する
- 分析結果を可視化する
- 可視化された分析結果から解釈を行う
- 解釈された結果から課題解決のためのアクションを考案する
データ分析はしばしば「属人化」しやすいと言われるゆえんはこのフローの中における個々人の問題意識やスキルレベルがばらついていることにより発生します。課題に対して同じデータベースから解決できそうなデータを抽出しても、人によって内容が異なることが往々にしてありますし、集計する際に重要な集計軸も人によってまちまちです。
過去の連載で基本的な可視化手法をご紹介したことがありますが、無機質なデータの羅列にストーリー性を持たせる可視化手法も人によってさまざまなパターンを使ったりします。最終的に結果を解釈することについてもそれぞれの解釈が存在するでしょう。
これらの分析アウトプットの品質を一定以上に担保するためには組織的な取り組みが重要です。すでに何度も指摘しているように課題を持っている担当者が適切にデータを扱える必要があるため、分析者がデータベーススキーマを把握し、適切なSQLクエリを書ける必要があります。SQLは他のプログラミング言語と違い、学生時代に触れる経験がないことが多いため、メンバーによる適切なナレッジシェアが重要です。