DeNAのKaggle日記

第2回:「Kaggle」の面白さとは--食品宅配サービスの購買予測コンペで考える

小野寺和樹 (ディー・エヌ・エー)

2018-08-29 06:50

 今回は、筆者がKaggleで準優勝した「Instacart Market Basket Analysis」というコンペについて話します。食料品の配達サービスを提供するInstacartのデータを活用して、ユーザーが次に購入する商品を予測するというものです。このコンペは2017年5月16日~8月14日の3カ月にわたって開催されました。

Instacartという企業について

 Instacartはオンラインで商品(食料品)を注文すると、最短1時間で自宅に配達してくれるサービスを提供している米国の企業です。こう書くとネットスーパーのように聞こえますが、正確に言えば買い物代行サービスであって、Instacart自身は在庫を持っていません。フードデリバリサービスのUber Eatsなどと同じように、ユーザーの代わりに買い物に行って、まとめて届けてくれるのです。

 実際、コンペに参加したKagglerの大半は同社を大手ネットスーパーだと思っていたようで、今でもそう思っている人はたくさんいると思います。コンペでは企業の情報を詳しく教えてもらえないので、詳細な情報を得たかったら自分で調べる必要があります。

Kaggleに提示された問題について

 提示された問題は前述の通り、各ユーザーが次回のページ訪問でどの商品を再購入するかを予測するというものです。

画像1

 ECサイトなどにおけるレコメンド機能のロジックを考える場合、購買履歴や行動履歴がない新商品や新規ユーザーに対する予測モデルの構築については、とても難易度が高くなります。今回のコンペ課題では、既存ユーザーの再購入を予測すればいいので、機械学習で解きやすい問題でした。

 Instacartの狙いは、ユーザーが快適に買い物できるように、目的の商品へたどり着くまでの時間を節約したいというものでした。そもそも時短を目的としたサービスなので、自分で買いに行った方が早いという状況では利用者が増えません。また、対象商品はスーパーに置いてある食料品であり、再購入での利用が大半を占めます。つまり同社のビジネスにとって重要な課題であり、かつ機械学習で解きやすいものなので、非常にうまい問題設計だったと思います。

与えられたデータについて

 これまで誰が何を購入したかを記録したログデータが提供されます。購入した時間や曜日が分かるため、例えば、朝と夜や1週間の中で、どういった商品の売れ行きが良いのかが簡単に分かります。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. ビジネスアプリケーション

    生成 AI 「Gemini」活用メリット、職種別・役職別のプロンプトも一挙に紹介

  2. セキュリティ

    まずは“交渉術”を磨くこと!情報セキュリティ担当者の使命を果たすための必須事項とは

  3. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  4. ビジネスアプリケーション

    急速に進むIT運用におけるAI・生成AIの活用--実態調査から見るユーザー企業の課題と将来展望

  5. セキュリティ

    マンガで分かる「クラウド型WAF」の特徴と仕組み、有効活用するポイントも解説

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]