課題2〜4:レコメンドに偏りがある
レコメンドの偏りは、アイテムの組み合わせ回数の蓄積データをそのまま利用するのではなく、段階評価のような形に変換することで解決できる。
例えば、あるアイテムに対して人気アイテムをレコメンドすると仮定して説明しよう。100アイテムのうち、仮に人気アイテムが上位2アイテムに偏っていた場合、1番人気のアイテムがレコメンドされる割合は50%、2番目に人気のアイテムがレコメンドされる割合が40%となることもある。このような場合、3位、4位のアイテムがレコメンドされる割合は数%で、5位以下のアイテムに至っては1%未満の割合でしかレコメンドされないことになる。
そこで、レコメンドするアイテムの幅を広げるため、各レコメンドアイテムに対する評価を5段階で再定義する。例えば、先ほどの人気度からレコメンドされる確率が25%以上のアイテムを評定A、1%以上を評定B、0.10%以上を評定C、0.05%以上を評定D、それ以下を評定Eとする、といった具合だ。この評定を基にレコメンドの割合を再設定することで、極端な偏りが回避できる。
また、パーソナライズド・レコメンダーでは、時間軸の重み付けとして、閲覧履歴や購入履歴のデータ取得日時も考慮している。例えば、3カ月前の閲覧履歴より、昨日の閲覧履歴の方が関連性が高いといった重み付けが可能だ。その時期やトレンドに合った精度の高いレコメンドをするために、ある一定の過去データはレコメンドのルール作成データから除外することもできる。
こうした重み付けに加え、ユーザーの嗜好とは判断できないものについても除外している。例えば、同一アドレスから同一アイテムに対する短時間でのアクセスやクローラー等のアクセスは、ルール作成データから除外している。また、「この商品を見た人はこの商品も見ています」といった形式で商品をレコメンドすると、レコメンド経由分の閲覧が多くなり、レコメンドした商品と元商品の関連性が強くなってしまう。そこで、レコメンド機能を介した画面遷移での閲覧履歴についてはルール作成データから除外している。
課題5:関連性のないカテゴリからレコメンドされる
課題5に対しては、カテゴリフィルタを利用することで回避できる。例えば旅行サイトの場合、国内旅行を希望するユーザーに海外旅行をレコメンドしても効果的ではない。また、アパレルサイトにて、女性に男性用の洋服をレコメンドするのは的外れだ。そのため、パーソナライズド・レコメンダーでは、各カテゴリを区別したレコメンドができるよう、カテゴリフィルタを導入している。