![]() |
「あなたにおすすめの商品」のからくりとは?--ECサイトのレコメンド技術を考える(2) |
前回は、レコメンド技術の歴史を振り返り、ネットマーケティングの変化やレコメンドソリューションの低価格化によってこの技術が再び注目されていることを説明した。今回は、レコメンド技術の種類について解説しようと思う。
ECサイトでよく用いられるレコメンデーションには、「人気商品ランキング」、「閲覧・購入履歴」、「あなたにおすすめの商品」といった3タイプがある。人気商品ランキングなら、数多く購入されている商品のランキングをトップページなどに表示し、閲覧・購入履歴であれば、Cookieから過去の履歴を基に「最近チェックした商品」として表示する。しかし、「あなたにおすすめの商品」となると、データを整理し、複雑のロジックから的確なものをレコメンドしなくてはならない。そこで必要となるのがレコメンド技術だ。
一言にレコメンド技術といっても、ネットマーケティングの変化により、求められる精度や手法は多岐に渡る。ベンダーが提供するASP型レコメンドソリューションも日々進化し、差別化が進んでいる。こうした中、現在のレコメンド技術を大別すると、1. ルールベース方式、2. コンテンツベースフィルタリング方式、3. 協調フィルタリング方式、4. ベイジアンネットワーク方式の4つが挙げられる。
ECサイトに用いられるレコメンド方式レコメンド方式をひとつずつ紹介する前に、まずはレコメンド機能の一連の流れを考えてみよう。レコメンド機能を3段階に分けると、次のようになる。
収集すべき情報とは、サイトの傾向分析によるマーケティングデータや、ユーザーが直接入力した会員情報およびアンケートによる顧客データ、購買や問合わせなどの利用履歴データ、ウェブアクセス履歴データなどが挙げられる。こうした情報を、サイト運営者による独自のルールか、レコメンドエンジンが自動作成するルールに基づいて分析し、マッチングした商品をレコメンドエリアに表示するまでがレコメンド機能の一連の流れとなる。表示方法は開発ベンダーや導入企業で異なるが、運営サイトのデザインなどとの兼ね合いによりカスタマイズすることが一般的だ。
この3段階の流れの中で、「レコメンドするための情報は何か」、「何をもってレコメンドするためのルールとするか」という切り口の違いが、最初に挙げた4つのレコメンド方式の違いに結びつく。
では、それぞれの方式についてひとつずつ説明しよう。
ルールベース方式は、「インテンショナル方式」とも呼ばれ、「デジタルカメラを買った人にSDカードを勧める」といった商品の関連性はもちろん、「紙おむつを買った人にビールを勧める」といったように、データマイニングでしか出てこないような意図的なレコメンドができるのが特徴だ。必要な情報はマーケティングデータや運営者の特別な意思となり、ルールとしては運営者が独自でレコメンドしたいアイテムを選択することになる。ただし、ユーザーの意思が反映しづらく、アイテム数が膨大になるとルール設定のメンテナンスや入力の手間がかかることが欠点だ。
コンテンツベース方式は、アイテムごとのスペック、値段、テキストといったコンテンツ情報の類似値を自動計算し、閲覧した商品に類似した商品をレコメンドする方式だ。例えば、ノートパソコンのサイズやメモリー容量、賃貸の間取りや家賃などがレコメンドに必要な情報となる。
複雑なものになると、音楽のメロディやテンポ、絵画の色彩、作者の心情などをひとつひとつポイント化して類似値を計算することも可能だ。この方式では、ユーザーの顕在的ニーズから極端にかけ離れたものは表示されず、アイテム間の類似値をあらかじめ用意しておけば導入直後でも目的に沿ったアイテムがレコメンドできる。しかし、現在はテキストマイニングによる分析手法が採用されているため、類似値が固定してしまい、同じようなアイテムばかりレコメンドされるという欠点がある。
協調フィルタリングは、ウェブアクセス履歴データなどユーザーの行動履歴を基に、ユーザー同士の嗜好の類似値を自動計算し、「この本を買った人はこんな本も買っています」といったレコメンドを実現する。代表例は「Amazon.com」のレコメンドで、現在ASP型ソリューションとして最も多く採用されている。この方式では、ユーザーの行動履歴のみを情報とし、コンテンツ情報を一切見ていないことが最大の利点だ。コンテンツ情報を見ないことで、ユーザーは「思いがけない発見」、つまり「セレンディピティ(serendipity)」が体験できるからだ。
セレンディピティとは、偶然から価値あるものを発見する「能力」を指し、1754年に小説家のHorace Walpole氏が生み出した造語だ。ウェブの世界では、検索エンジンやレコメンデーションからユーザーが予期しない商品やコンテンツを見つけることを指す。自分の嗜好に類似した人が見た商品は、今まで自分が見た商品とはまったく関係ないのに自分の嗜好にマッチしている、といった偶然の発見がセレンディピティなのだ。
第1回でも説明したが、このセレンディピティこそ協調フィルタリングの醍醐味であり、ECサイトがレコメンド技術に求める効果の1つだ。また、コンテンツ情報をあらかじめ用意する必要もないため管理コストがかからず、膨大なユーザーアイテムに対応できるため、運営者にとっては導入しやすいレコメンド方式といえる。
ところが、この協調フィルタリングの利点が、欠点にもなってしまうことを明記しておかなくてはならない。コンテンツ情報を一切見ないため、たとえユーザーの行動履歴に類似性があり、嗜好が類似していると判断してレコメンドしても、その結果がユーザーの意図に沿わないこともあるからだ。もしくは、購入したものが友達から頼まれたものや、数年に一度しか購入しないレアなものだった場合、当面の間はその商品を基にレコメンドされてしまうこともある。さらに、ユーザー行動履歴が十分に蓄積されていない導入直後には、ほとんど精度が期待できないことも欠点だ。
ベイジアンネットワークは、コンテンツベースや協調フィルタリングとは違い、ベイズ理論を用いて統計学的な切り口からレコメンドする方式だ。ベイズ理論とは、18世紀の数学者Thomas Bayes氏が提唱した確率論で、「未来に起こる事象は、過去の多角的な発生頻度を計算することにより予想できる」という考えに基づいている。単純な確率計算とは違い、多くの事象を踏まえた上で確率を計算することにより、精度の高い予測ができるというものだ。
この理論は、GoogleやMicrosoft、IntelなどIT関連の開発はもちろん、人工知能技術や経営学、政治など、幅広い分野で用いられている。身近な例では、プロ野球のドラフトやスパムフィルターにも採用されている。
これをレコメンド技術に応用すると、多くのコンテンツ情報やユーザー行動履歴などの細部にわたる事象を計算し、ユーザーが購入する確率の高い商品がレコメンドできると考えられることから、次世代レコメンド方式として注目されている。そのため、各社が研究開発に取り組んでいるが、過去にはMicrosoftが導入して失敗した事例もある。現在は、ゼロスタートコミュニケーションの「zero-zone」でこの方式が採用されているが、まだ一般的な成功事例としては報告されていない。この方式は、しばらくは今後に期待すべき分野と言えるだろう。
レコメンド技術の4つの方式は以上だ。それぞれの方式に一長一短があり、導入するECサイトによって効果的なレコメンド方式は異なってくるため、サイトの目的に合わせた選択が必要だ。また、レコメンド方式は、掛け合わせて利用することも可能で、例えばケイビーエムジェイの「パーソナライズド・レコメンダー」では、協調フィルタリング方式とルールベース方式を掛け合わせて利用できるサービスとなっている。
次回は、現在最も採用されている「協調フィルタリング」に焦点を当て、ロジックを含めた詳細を解説しようと思う。
高島理貴(たかしま まさき)
ケイビーエムジェイ インターネットプロダクト&マーケティング事業部 プランニング&コンサルティング グループ アクセス解析チーム チームリーダー Newビジネス企画 担当。埼玉県生まれ。年間総計30億ページビュー以上のサイトを解析し、クライアントのサイトの成長をお手伝いするアクセス解析コンサルタント。
ZDNET Japanは、Ziff Davisからのライセンスに基づき株式会社4Xが運営しています。
ZDNET Japan is operated by 4X Corp under license from Ziff Davis.
Copyright © 2026 4X Corp, Inc. All rights reserved. No reproduction or republication without written permission.