今回は統計言語「R」でクラスター分析を実施します。
ビジネスの現場では、Philip Kotler氏の提唱したSTPマーケティングが浸透しています。STPとは、それぞれ「セグメンテーション」「ターゲティング」「ポジショニング」の頭文字をとったものです。概要を説明すると、市場において適切な顧客をグループ化(セグメンテーション)し、そのセグメントに沿って適切にアプローチし(ターゲティング)、その顧客群に対して自社がどのようなベネフィットを与えられるかの地位を確立する(ポジショニング)ということです。
このような考えに基づいて、企業のマーケティング活動が展開されてきました。セグメンテーションは従来、ハードな属性情報と呼ばれる人口統計的データを使うことが多いでしょう。例えば、性別や年代、居住地、職業、年収などの比較的変化の少ないデータのことです。また、アンケートなどを実施することで価値観やライフスタイル、商品カテゴリ寄与度などの内的な要因を元に分類する心理的データも活用されているでしょう。
しかし、前者のデータによるセグメントでは、ほとんど変化がないため、画一的なアプローチしかできず、後者のデータは継続して入手し続けることは困難です。このように、従来のセグメンテーションによるマーケティングは限界を迎えてきています。
そこで、新しい顧客分類の手法としてクラスター分析が注目されてきています。
クラスター分析とは何か
クラスター分析とは、データの集まりをデータ間の類似度(または非類似度)にしたがって、いくつかのグループに分けて分析することです。
定義の説明だけでは、なかなか伝わりづらい部分もあるので、ごく簡単な例を示しましょう。下記のようなデータ群があったとします。
このデータ群を何らかの基準の元に分類したいとします。