AWSの自律走行車レースで日本勢が優勝--機械学習の学び方

國谷武史（編集部）

2019-12-13 06:00

　Amazon Web Services（AWS）は、2018年の年次カンファレンス「re:Invent 2018」で、機械学習を利用する自律走行型レーシングカー「AWS DeepRacer」を発表し、レースイベント「AWS DeepRacerリーグ」を世界中で実施してきた。12月に開催された「re:Invent 2019」では、その最終となる優勝決定戦が行われ、日本勢がワンツーフィニッシュを飾った。

AWS DeepRacerリーグで優勝したDNPデジタルソリューションズの瀧下初香さん（参加名「SOLA」さん、中央）、2位の大野史暁さん（同「FUMIAKI」さん、左）、代表取締役社長の福田祐一郎氏（右）

　優勝したのは「SOLA」さん、2位は「FUMIAKI」さんで、2人は大日本印刷（DNP）グループでIT事業を手掛けるDNPデジタルソリューションズの社員だ。なお、3位は台湾の「ROGER」さんで、アジア勢が上位を独占。re:Invent 2019でSOLAさん、FUMIAKIさん、DNPデジタルソリューションズ代表取締役社長の福田祐一郎氏に、DeepRacerリーグへの取り組みを聞いた。

　丸みを帯びたボディーのDeepRacerは、内部にIntel Atomプロセッサー、1080p解像度の4メガピクセルカメラ、802.11acのWi-Fi、複数のUSBポート、約2時間持続するバッテリーなどを搭載する。コース内の位置情報やカメラが捉えるコース映像、参加者が開発するアルゴリズムなどによって自律走行する。アルゴリズムは強化学習で開発が進められる。コース1周の最速タイムを競うDeepRacerリーグでは、アルゴリズムの精度が勝敗を左右する。

AWS re:Invent 2019で開催されたDeepRacerリーグの優勝決定戦

　福田社長によれば、DeepRacerへの取り組みはre:Invent 2018に参加した社員からの希望でスタートした。同氏は、5月に実施した記者会見でもその活動状況を紹介しているが、6月の「AWS Summit Tokyo」で行われた国内大会では1～3位を獲得し、re:Invent 2019の世界一決定戦に挑むに至った。

　「社内にコースを作り、AWSから貸していただいた実車で試してみたり、他社にも開放して34社40人でレースを行ったりした。教育機関やAWSのユーザー会でも活発なコミュニケーションが行われ、参加した社員の個々人の努力、周囲のサポート、そしてメンバー同士の連携が成果につながった」（福田社長）

　なお、DeepRacerの実車は電波関連規制のため日本では販売されておらず、AWSジャパンが規制対応した特別モデルをイベントなどの際に参加者へ貸し出した。そのため普段の開発作業は、オンライン上のコンソールや仮想コースのシミュレーションを通じて行われている。

　優勝したSOLAさんは、大阪のコミュニケーション開発本部に所属する瀧下初香さん。「まさか最後まで残れるとは思っていなかった」と話す。2位のFUMIAKIさんは、東京のWebシステム制作本部に所属する大野史暁さんで、当初は事務局のメンバーだったが、途中から参加者側に回った。「SOLAさん（瀧下さん）が優勝すると信じていた」という。

　2人とも普段は別々の業務を担当しており、機械学習への取り組みはDeepRacerが初めてだった。上述のように実車に触れる機会が限られ、コンソール上での開発が中心になった。「あらかじめ強化学習のための環境がパッケージで用意されていたので取り組みやすかった。実車とシミュレーション環境では、作成したアルゴリズムの成果に違い生じることも多く、どう開発していくかが難しかった」（大野さん）

　アルゴリズムの開発では、DeepRacerが理想的な動作を行った結果に高い報酬関数を与えて学習させていく。理想的なコース上の経路に対してDeepRacerが走行した位置との誤差が小さければ報酬関数のポイントが高く、誤差が大きいとポイントは低くなる。与えられたポイントが高くなればなるほどアルゴリズムの精度も向上していく。ただしコースレイアウトは一様でなく、定期的にAWSが新たなレイアウトを追加していくため、レイアウトが変わっても理想的な経路を走行できるようにアルゴリズムの精度を高めていく必要がある。

　瀧下さんと大野さんは、通常業務の合間などにアルゴリズムの開発を進めてきたという。「最初に3種類の報酬関数のサンプルが用意されており、プログラミングに詳しくない人でも簡単に始められる。サンプルをベースに開発を進めた」（瀧下さん）

　大野さんも、「車の位置の座標軸や速度、傾き、ハンドルを切る角度といったパラメーターを設定、調整し、コースの中心を忠実にたどれたり、あるいはコーナーを速く曲がれたりした際の報酬関数の評価を高くしてアルゴリズムの開発を進めた。複数のコースを学習してどこでも通用できるようになれば、アルゴリズムのロバスト性を得られる」と話す。

コース1周を最も速く正確に走りきるアルゴリズムが勝敗を左右した

　実は、瀧下さんはペーパードライバーで、大野さんもFormula One（F1）が趣味というが、日常的に車を運転しているわけではないという。2人とも実際の自動車レースの経験はなく、大野さんは「報酬関数につながる車の動きをラジコンカーの操作でも練習した」とのこと。瀧下さんは、「iPadの画面上で操作しながら、安全運転でなるべくコースの中にとどまるように走るよう練習した」という。

　レースカーの操作感覚を養いながら、DeepRacerの走行アルゴリズムの開発を進めた。アルゴリズムは、一般的に学習が進めば進むほど精度が向上すると思いがちだが、ある段階で学習したものを汎用化できなくなる「過学習（過剰適合）」に陥る。「パラメーターの数や学習時間などによって過学習が起きやすいことがあり、実際に国内大会では8時間の学習がベスト、10時間を超えるとおかしくなることがあった。開発はアルゴリズムの修正作業に注力するイメージ」（大野さん）という。

　レースを勝ち進めていく課程では、社内外のメンバーとの交流が深まったり、海外の参加者との関係を築けたりと、技術以外に得たものも大きいという。活動の場は主に東京だったが、瀧下さんのように遠隔地のメンバーはビデオ会議も使って参加した。「普段はSlackでやりとりをしていて実際に初めて顔を合わせてもすぐに打ち解けることができた」（大野さん）、「会ったことのない人に話しかけられて驚いたり、（re:Invent 2019の会場では）日本人も多く、日本語で会話をして緊張をやわらげられたりして新鮮だった」（瀧下さん）

優勝した瀧下さん、2位の大野さんにトロフィーが贈られた

　re:Invent 2019の決勝戦の特設コースでは、瀧下さんが安定して好タイムを重ね、最速10秒236で優勝、大野さんのベストタイムは11秒056で、3位のROGERさんは12秒156だった。3人には表彰のトロフィーが贈られた。

　会社を挙げたDeepRacerへの取り組みについて福田社長は、「社内にチャレンジする文化があり、社員が新しい環境に手を挙げられる風土が深まったのではないか。これによって急いでAI（人工知能）の専門家を確保したり、機械学習を事業化したりするわけではないが、AIが分かるエンジニアを育てたい。さまざまな可能性のベースになり、データセンターの効果的な冷却方法を探るといった応用の幅が広がる。人材育成や社外とのコラボレーションにも生かしていく」と意義を語る。

最新モデルの「AWS DeepRacer Evo」

　re:Invent 2019では、DeepRacerの新モデルが発表された。搭載するカメラが2台になるなどセンシング機能が強化され、アルゴリズムの開発もより難しくなると想定される。同社は、2020年のDeepRacerリーグへの参戦は検討中だが、新年早々に瀧下さんと大野さんの祝勝会を企画しているという。

　（取材協力：アマゾンウェブサービスジャパン）