編集部からのお知らせ
動画セミナー「Security Trend Winter」公開中!
最新記事まとめ「医療IT」

協調フィルタリングの課題を解決する--ECサイトのレコメンド技術を考える(4) - (page 3)

高島理貴(ケイビーエムジェイ)

2008-06-18 08:00

課題2〜4:レコメンドに偏りがある

 レコメンドの偏りは、アイテムの組み合わせ回数の蓄積データをそのまま利用するのではなく、段階評価のような形に変換することで解決できる。

 例えば、あるアイテムに対して人気アイテムをレコメンドすると仮定して説明しよう。100アイテムのうち、仮に人気アイテムが上位2アイテムに偏っていた場合、1番人気のアイテムがレコメンドされる割合は50%、2番目に人気のアイテムがレコメンドされる割合が40%となることもある。このような場合、3位、4位のアイテムがレコメンドされる割合は数%で、5位以下のアイテムに至っては1%未満の割合でしかレコメンドされないことになる。

 そこで、レコメンドするアイテムの幅を広げるため、各レコメンドアイテムに対する評価を5段階で再定義する。例えば、先ほどの人気度からレコメンドされる確率が25%以上のアイテムを評定A、1%以上を評定B、0.10%以上を評定C、0.05%以上を評定D、それ以下を評定Eとする、といった具合だ。この評定を基にレコメンドの割合を再設定することで、極端な偏りが回避できる。

レコメンドアイテム再定義 図:レコメンドアイテムの再定義

 また、パーソナライズド・レコメンダーでは、時間軸の重み付けとして、閲覧履歴や購入履歴のデータ取得日時も考慮している。例えば、3カ月前の閲覧履歴より、昨日の閲覧履歴の方が関連性が高いといった重み付けが可能だ。その時期やトレンドに合った精度の高いレコメンドをするために、ある一定の過去データはレコメンドのルール作成データから除外することもできる。

 こうした重み付けに加え、ユーザーの嗜好とは判断できないものについても除外している。例えば、同一アドレスから同一アイテムに対する短時間でのアクセスやクローラー等のアクセスは、ルール作成データから除外している。また、「この商品を見た人はこの商品も見ています」といった形式で商品をレコメンドすると、レコメンド経由分の閲覧が多くなり、レコメンドした商品と元商品の関連性が強くなってしまう。そこで、レコメンド機能を介した画面遷移での閲覧履歴についてはルール作成データから除外している。

課題5:関連性のないカテゴリからレコメンドされる

 課題5に対しては、カテゴリフィルタを利用することで回避できる。例えば旅行サイトの場合、国内旅行を希望するユーザーに海外旅行をレコメンドしても効果的ではない。また、アパレルサイトにて、女性に男性用の洋服をレコメンドするのは的外れだ。そのため、パーソナライズド・レコメンダーでは、各カテゴリを区別したレコメンドができるよう、カテゴリフィルタを導入している。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

関連記事

関連キーワード
KBMJ

特集

CIO

モバイル

セキュリティ

スペシャル

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]