ヒストグラム、パレート図
ヒストグラムは、量的データの分布を可視化するために用います。データを階級に分けてその度数分布を作成し、横軸にデータ区間、縦軸に度数を取り、可視化します。下記はデータ区間を5センチごとに取った身長のヒストグラムです。
このようにヒストグラムを描くことで、どの階級に人数が多く集中しているか、すぐに可視化できます。また、ヒストグラムにおいてはこのデータ区間の決定は非常に重要です。この区間の決め方次第で、分布が全く異なってしまうからです。異なった分布によるミスリードは避ける必要があります。
ヒストグラムと少し似ていますが、パレート図という可視化方法もあります。パレート図は値を降順に並べた棒グラフと、その累積割合を折れ線で表したグラフです。
パレート図によって、自社商品の売り上げを可視化することで、売上構成比を分析する「デシル分析」や管理方式を選定、実施するなど優先順位をつける時に用いる「ABC分析」などにも活用することができます。
以上のように、可視化の方法も目的によってさまざまな方法があります。何をどのように見せたいのか、適切な可視化方法は何かなどをしっかりと検討し、データを可視化することが非常に重要です。さらに可視化されたものをチェックする側でも、気をつけておくべきポイントを押さえることで、誤った意思決定をしないように注意しておく必要があります。
- 伊藤徹郎
- 金融機関で営業からモバイル開発までの幅広く経験。その後、ALBERTにデータ分析者として参画。レコメンデーションのアルゴリズム開発やECサイト、小売りなどのCRM分析、広告分析など、幅広いデータをあつかう。Tokyo.Rなどの社外コミュニティでも活動中。