筆者が所属するケイビーエムジェイの「パーソナライズド・レコメンダー」は、連載第1回でも述べたECサイトの目標である「ユーザーにより多くの商品を見てもらい、より多くのユーザーをコンバージョンに結び付ける」という命題を実現するため、協調フィルタリング×アイテムベースを採用している。その詳細なロジックとアイテムベースを採用する理由について、これから詳しく説明しよう。
協調フィルタリング×アイテムベースのロジックとは
まず、ユーザーの暗黙的なユーザー行動履歴情報を取得するために、ウェブビーコン(ウェブページに埋め込まれた情報収集用の極めて小さい画像)を設置する。例えば、商品c の商品購入完了ページにウェブビーコンを設置すると、ユーザーAが商品c を購入した際に表示される商品購入完了ページの表示履歴が購入履歴としてデータベースに蓄積される。この繰り返しで蓄積される情報を基に、図2のようなクロス集計が作成される。
協調フィルタリング×アイテムベースの基本処理を概念的に説明すると、4段階のクロス集計プロセスを経てルールを作成することになる。これを図解すると図3のようになる。
処理の1段階目では「セットで購入されるアイテム間の関連性のみ」を集計するため、商品ごとの購入回数は無視し、一度でも購入があった場合を「1」に、全く購入がなかった場合を「0」に変換する。図3の?を見ると、商品a と商品c をセットで購入した人は、ユーザーA、ユーザーC、ユーザーEの3人だとわかる。
2段階目は、「同一人物が購入した商品の組み合わせの回数」を集計する。図3の?のように、軸アイテムとなる商品a と、その商品とセットで購入した商品c との組み合わせ回数は3回だとわかる。このように2段階目は、軸アイテムとセット購入アイテムをクロス集計し、アイテム間の関連性を分析する。
3段階目は、「組み合わせの総和からセットで購入される割合を計算」する。そして、4段階目にこの割合をテーブル化することにより、「商品a を購入した人に対して商品c を43%、商品g を29%、商品e を14%の割合でレコメンドする」というルールが作成される。これが協調フィルタリング×アイテムベースの基本処理の流れだ。