前回はデータの尺度や基本統計量について解説しました。このような基本を踏まえた上で、データ分析は実際にどういった観点で実施されているのでしょうか。
データ分析に「収集したデータに対して、何らかの手法を適用すれば予想もしなかった価値ある発見が可能になる」という誇大な印象を持つ人もいますが、実際にはそのようなことはほとんどありません。先のイメージに対して、現実は「荒涼とした草原から果実を収穫する」というほうが近いと思います。今回はデータ分析の実際の手順などを解説していきます。
どこを発掘するのか
一般的にECサイトなどの企業がデータマイニングを実施する場合、「商品データ」「販売データ」「顧客データ」「購買行動に影響を与える外部データ」「購買行動に影響を与える内部データ」の5つが挙げられます。
まず、これらのデータがどこで蓄積されているのか、不足している場合はどのようにデータを収集するかを検討しなければなりません。販売データはマーケティング部、販促系のデータはプロモーション部、顧客データはカスタマーサポート部というように、部署によって管理されているデータが異なる可能性もあります。こういった際は、データを管理している部署から活用する部署に融通してもらう必要があるでしょう。