DeNAのKaggle日記

第3回:チームで取り組むKaggleの面白さ--コンペ準優勝の裏側とは? - (page 3)

加納龍一 (ディー・エヌ・エー)

2018-09-28 06:50

チームでの取り組み

 各々が個性的に活動する部分もあれば、チーム内で共有が必要な情報も出てきます。例えば、データを注意深く見ていく中で、与えられたローン申し込みの中には、申込者の生年月日、性別、雇用開始日、Home Creditのアカウント発行日などが完全に重複しているものが多数存在していることが発見されました。それらの情報が偶然一致する確率は天文学的なもので、同一人物がHome Creditで複数回ローンを申し込んでいると考えられます。こういった情報は公開されておらず、注意深くデータを見ていたチームしか見つけられていなかったようです。同一人物の時系列情報は有効な特徴量になるため、ここで差を付けられたのも上位入賞の大きなポイントでした。

 この件を発見できた裏側には、わずかな発見でも綿密に連絡を取り合うことで、迅速にデータへの理解や各々の意見が共有できるチーム体制ができていたのが本質的な要因であったと感じています。色々な人と議論しながらデータ分析のアイデアを作り上げていくことで、一人で探すよりも、とても効率的に理解を深められたと思います。

 実際にコンペ期間中は、メンバーとかなり密に連携を取り合っていました。私は、チーム内のDeNAメンバーと週に2回の定例会を継続して行ってきました。他の日本人メンバーをDeNAの会議室に招いて、面と向かって会議を行ったりもしました。基本的にはSlackで連絡を取り合っていたのですが、チームのワークスペースでは1万件までしかメッセージが保存されない中、1万件は簡単に超えてしまうほどのメッセージがやり取りされていました。

 そういった場で各々のメンバーが取っているアプローチを共有してもらうことで、それにインスパイアされて新たな手法が思い浮かぶといったこともあります。また、過去の失敗談や成功談を共有してもらうこともあります。そういった多種多様な視点からの経験を知ることが、学びにつながり、自らのデータサイエンティストとしての成長につながっていっているなと感じています。

チームで取り組むことの醍醐味

 私は、チームで何かに取り組むということが好きです。というのも、上述した通り、チームメンバーの色々な人の考え方や技術に触れられるためです。今回のコンペも、私を除く11人のチームメンバーから色々な学びを得られたと感じています。

 また、やはり何と言っても仲間と一緒に結果を喜べるというのは幸せです。私は今回のコンペで上位成績を残せたので、これまでの実績と合わせて「Kaggle Master」の称号を獲得できました。下に示しているような画面がKaggleのプロフィールで確認できるのですが、背景の色はKagglerのランクを示しています。このコンペが終了するまでは紫色だった画面がKaggle Masterの称号を得たことを示すオレンジ色となっていることをチームメンバーと一緒に確認してハイタッチをしたときは、本当に嬉しかったです。

Kaggleのプロフィール画面。枠線の色でランクが示されており、オレンジはKaggle Master
Kaggleのプロフィール画面。枠線の色でランクが示されており、オレンジはKaggle Master

 今度メンバーとの打ち上げも予定されているのですが、それも楽しみです。

今後について

 私は、今後も自己研さんのためKaggleでの取り組みを続けるつもりです。Kaggleには今回のようなテーブルデータを使ったコンペだけでなく、例えば画像データを使ったものや言語データを使ったものなどアプローチが全く異なるコンペも多数存在します。技術の引き出しを広げるためにも、幅広い種類のコンペに積極的に取り組みたいと考えています。

 さらに、日々技術はものすごいスピードで進化しています。例えば、1年くらい前まではXGBoostと呼ばれる勾配ブースティングの手法がKaggleのコンペの上位解法を独占していたのですが、現在はLightGBMと呼ばれる手法に置き換えられてしまい、XGBoostを使っている人はかなり減ったように見えます。このように、上位入賞したといっても、おごれるような世界ではありません。学ぶべきことは無限に増えていきます。

 そんな中で、もっと色々な人の視点や考え方に触れながら成長していきたいという気持ちを私は持っています。もし機会がありましたら、一緒に読者の皆さんともKaggleに取り組んでみたいなと思うくらいです。Kaggleのポータル上で声を掛けてもらうだけでもチームを組めますので、興味がありましたら是非ご一緒しましょう。きっとお互いに学びがあり、成長につながる経験になるのではないかと思います。

 そしてKaggleを通して得られたデータサイエンティストとしての成長が、事業を通じて誰かの幸せにつながればいいなと感じています。今回の2位入賞やKaggle Masterの称号獲得というのは通過点でしかなく、誰かの幸せに貢献できて、ようやくKaggleに取り組むことの成果が得られたことになるのだと思っています。

加納龍一
加納龍一
ディー・エヌ・エー システム本部 AIシステム部 データサイエンスグループ
前職では動画圧縮アルゴリズムの世界標準化活動に従事する傍ら、単身でKaggleに参戦してきた。広告効果予測コンペや貸し倒れ予測コンペでの金メダル獲得など、上位実績を収めている。2018年6月にDeNA入社。主に、オートモーティブ事業への機械学習活用へ向けた開発を行っている。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]