データサイエンティスト講座

何を読み取るのかが重要--統計言語「R」でクラスター分析

伊藤徹郎(ALBERT)

2014-08-18 07:00

 今回は統計言語「R」でクラスター分析を実施します。

 ビジネスの現場では、Philip Kotler氏の提唱したSTPマーケティングが浸透しています。STPとは、それぞれ「セグメンテーション」「ターゲティング」「ポジショニング」の頭文字をとったものです。概要を説明すると、市場において適切な顧客をグループ化(セグメンテーション)し、そのセグメントに沿って適切にアプローチし(ターゲティング)、その顧客群に対して自社がどのようなベネフィットを与えられるかの地位を確立する(ポジショニング)ということです。

 このような考えに基づいて、企業のマーケティング活動が展開されてきました。セグメンテーションは従来、ハードな属性情報と呼ばれる人口統計的データを使うことが多いでしょう。例えば、性別や年代、居住地、職業、年収などの比較的変化の少ないデータのことです。また、アンケートなどを実施することで価値観やライフスタイル、商品カテゴリ寄与度などの内的な要因を元に分類する心理的データも活用されているでしょう。

 しかし、前者のデータによるセグメントでは、ほとんど変化がないため、画一的なアプローチしかできず、後者のデータは継続して入手し続けることは困難です。このように、従来のセグメンテーションによるマーケティングは限界を迎えてきています。

 そこで、新しい顧客分類の手法としてクラスター分析が注目されてきています。

クラスター分析とは何か

 クラスター分析とは、データの集まりをデータ間の類似度(または非類似度)にしたがって、いくつかのグループに分けて分析することです。

 定義の説明だけでは、なかなか伝わりづらい部分もあるので、ごく簡単な例を示しましょう。下記のようなデータ群があったとします。


 このデータ群を何らかの基準の元に分類したいとします。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

関連記事

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]