DeNAのKaggle日記

第3回:チームで取り組むKaggleの面白さ--コンペ準優勝の裏側とは? - (page 3)

加納龍一 (ディー・エヌ・エー) 2018年09月28日 06時50分

  • このエントリーをはてなブックマークに追加
  • 印刷

チームでの取り組み

 各々が個性的に活動する部分もあれば、チーム内で共有が必要な情報も出てきます。例えば、データを注意深く見ていく中で、与えられたローン申し込みの中には、申込者の生年月日、性別、雇用開始日、Home Creditのアカウント発行日などが完全に重複しているものが多数存在していることが発見されました。それらの情報が偶然一致する確率は天文学的なもので、同一人物がHome Creditで複数回ローンを申し込んでいると考えられます。こういった情報は公開されておらず、注意深くデータを見ていたチームしか見つけられていなかったようです。同一人物の時系列情報は有効な特徴量になるため、ここで差を付けられたのも上位入賞の大きなポイントでした。

 この件を発見できた裏側には、わずかな発見でも綿密に連絡を取り合うことで、迅速にデータへの理解や各々の意見が共有できるチーム体制ができていたのが本質的な要因であったと感じています。色々な人と議論しながらデータ分析のアイデアを作り上げていくことで、一人で探すよりも、とても効率的に理解を深められたと思います。

 実際にコンペ期間中は、メンバーとかなり密に連携を取り合っていました。私は、チーム内のDeNAメンバーと週に2回の定例会を継続して行ってきました。他の日本人メンバーをDeNAの会議室に招いて、面と向かって会議を行ったりもしました。基本的にはSlackで連絡を取り合っていたのですが、チームのワークスペースでは1万件までしかメッセージが保存されない中、1万件は簡単に超えてしまうほどのメッセージがやり取りされていました。

 そういった場で各々のメンバーが取っているアプローチを共有してもらうことで、それにインスパイアされて新たな手法が思い浮かぶといったこともあります。また、過去の失敗談や成功談を共有してもらうこともあります。そういった多種多様な視点からの経験を知ることが、学びにつながり、自らのデータサイエンティストとしての成長につながっていっているなと感じています。

チームで取り組むことの醍醐味

 私は、チームで何かに取り組むということが好きです。というのも、上述した通り、チームメンバーの色々な人の考え方や技術に触れられるためです。今回のコンペも、私を除く11人のチームメンバーから色々な学びを得られたと感じています。

 また、やはり何と言っても仲間と一緒に結果を喜べるというのは幸せです。私は今回のコンペで上位成績を残せたので、これまでの実績と合わせて「Kaggle Master」の称号を獲得できました。下に示しているような画面がKaggleのプロフィールで確認できるのですが、背景の色はKagglerのランクを示しています。このコンペが終了するまでは紫色だった画面がKaggle Masterの称号を得たことを示すオレンジ色となっていることをチームメンバーと一緒に確認してハイタッチをしたときは、本当に嬉しかったです。

Kaggleのプロフィール画面。枠線の色でランクが示されており、オレンジはKaggle Master
Kaggleのプロフィール画面。枠線の色でランクが示されており、オレンジはKaggle Master

 今度メンバーとの打ち上げも予定されているのですが、それも楽しみです。

今後について

 私は、今後も自己研さんのためKaggleでの取り組みを続けるつもりです。Kaggleには今回のようなテーブルデータを使ったコンペだけでなく、例えば画像データを使ったものや言語データを使ったものなどアプローチが全く異なるコンペも多数存在します。技術の引き出しを広げるためにも、幅広い種類のコンペに積極的に取り組みたいと考えています。

 さらに、日々技術はものすごいスピードで進化しています。例えば、1年くらい前まではXGBoostと呼ばれる勾配ブースティングの手法がKaggleのコンペの上位解法を独占していたのですが、現在はLightGBMと呼ばれる手法に置き換えられてしまい、XGBoostを使っている人はかなり減ったように見えます。このように、上位入賞したといっても、おごれるような世界ではありません。学ぶべきことは無限に増えていきます。

 そんな中で、もっと色々な人の視点や考え方に触れながら成長していきたいという気持ちを私は持っています。もし機会がありましたら、一緒に読者の皆さんともKaggleに取り組んでみたいなと思うくらいです。Kaggleのポータル上で声を掛けてもらうだけでもチームを組めますので、興味がありましたら是非ご一緒しましょう。きっとお互いに学びがあり、成長につながる経験になるのではないかと思います。

 そしてKaggleを通して得られたデータサイエンティストとしての成長が、事業を通じて誰かの幸せにつながればいいなと感じています。今回の2位入賞やKaggle Masterの称号獲得というのは通過点でしかなく、誰かの幸せに貢献できて、ようやくKaggleに取り組むことの成果が得られたことになるのだと思っています。

加納龍一
加納龍一
ディー・エヌ・エー システム本部 AIシステム部 データサイエンスグループ
前職では動画圧縮アルゴリズムの世界標準化活動に従事する傍ら、単身でKaggleに参戦してきた。広告効果予測コンペや貸し倒れ予測コンペでの金メダル獲得など、上位実績を収めている。2018年6月にDeNA入社。主に、オートモーティブ事業への機械学習活用へ向けた開発を行っている。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

関連ホワイトペーパー

連載

CIO
月刊 Windows 10移行の心・技・体
ITアナリストが知る日本企業の「ITの盲点」
シェアリングエコノミーの衝撃
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「展望2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
セキュリティインシデント対応の現場
エンドポイントセキュリティの4つの「基礎」
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
エンタープライズAIの隆盛
インシュアテックで変わる保険業界
顧客は勝手に育たない--MAツール導入の心得
「ひとり情シス」の本当のところ
ざっくり解決!SNS担当者お悩み相談室
生産性向上に効くビジネスITツール最前線
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell Technologies World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]