”類似度”の計算方法について具体的に説明しましょう。
実はこれまで”商品全体をまたいだ”類似度ばかりが重視され、意外と化粧品・家電などの商品群ごとの類似度はあまり考慮されていませんでした。
またそれを考慮しようとすると計算量などの面で問題があったので、これを克服するためのアルゴリズムを開発したというものです。なお、本手法については別途、報告予定です。
また、別の研究では、同じ協調フィルタリングに対する拡張でも、解くべき問題の視点を変え、協調フィルタリングでは従来から問題とされている“新規ユーザーに対して商品のレコメンドができない” コールド・スタート問題に焦点を当てています。
上述したようにユーザー同士の“類似度“を何らかの方法で計算するのが協調フィルタリングの肝なわけですが、この問題は、新規ユーザーの場合には類似度を計算するための参考情報が何もないために類似度が計算できず、このままではお手上げになることに起因します。
提案されていた手法では、この問題を解決するために、推薦を行う場のデータ以外の“第二のデータソース”からユーザー同士の関係性を導き出すことを考えます。
具体的にはソーシャルネットワークをデータソースとして活用することで、そこから新規ユーザーの情報もできるだけ収集しユーザー間の類似度を計算できるようにします。
さらに(最近界隈では流行りの)スパースな行列(行列の要素にたくさん0が入っているような行列)の推定問題として定式化することで、計算のボトルネックとなっていた最適化問題も同時に解決するという方法でした。
コールド・スタート問題の解決策は直近でも色々提案されているようなので今回の講演も含めて「こういう考え方もあるのか!」と非常に勉強になりました。
<後編に続く>
- 高柳慎一(たかやなぎ しんいち)
- 株式会社リクルートコミュニケーショズ
- 材料科学系財団、金融系シンクタンクを経て現職。 専門分野は統計科学、リクルートが保有するビッグデータを活用するための機械学習・人工知能の開発を担当。 訳著書『金融データ解析の基礎』共立出版 (2014)、『みんなのR』マイナビ(2015)など多数。
ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)
特集
- デジタル岡目八目
- さまざまなLinuxディストリビューションの世界
- 技術者視点で見るメインフレームの進化と深化
- 松岡功の「今週の明言」
- 中国ビジネス四方山話
- Linuxノウハウ
- 松岡功の一言もの申す
- 「GIGAスクール構想」で進化する教育現場
- カーボンニュートラル(脱炭素)
- トップインタビュー
- ICT来し方行く末
- トランスフォーメーションの破壊者:インテントAI
- 流通テック最前線
- PDF Report at ZDNET Japan
- 持続可能な地域社会を目指す「地域DX」
- 世界のICTが集まるアイルランド
- DXで直面するカベを突破せよ
- デジタルジャーニーの歩き方
- 「働く」を変える、HRテックの今
- CIO・情シス部長が知っておきたい「データクラウド」の基本と構造
- 企業セキュリティの歩き方
- ビジネス視点で分かるサイバーのリスクとセキュリティ
- Ziddyちゃんの「私を社食に連れてって」
- 対応必須化の波が到来したSBOM動向
- サプライチェーン管理高度化のススメ
- 製造業のサイバーセキュリティ・進化する脅威と対策方法
- 新潮流Device as a Serviceの世界
- ラズパイをより身近に
- プロダクトの力でビジネスを推進する
- 「責任あるAI」--AIに倫理感を持たせるには