富士通研究所と沖縄科学技術大学院大学(以下、OIST)は、10月12日、強化学習アルゴリズムの共同研究を開始したと発表した。この研究では、脳科学の最新の知見を活用して、人間のように応用力のある強化学習アルゴリズムの開発し、実社会で広く適用可能なAI(人工知能)の実現を目指す。
共同研究の成果を元に、人手による設定・調整なしで、環境に適応した方策をより効率的にコンピュータに獲得させて、ICTシステム管理、エネルギーマネジメントなどへの応用を実施する。また、富士通研究所は、富士通のAI技術「Human Centric AI Zinrai」の核となる新技術の開発にも生かしていく。
脳科学の知見活用では、さまざまな情報から本質的なものを選んだり、過去の学習を新しい問題の解決に役立てる人間の脳の働きを利用する。これにより、注目すべき情報をあらかじめ設計者が指定したり、問題ごとに学習をやり直したりする必要がある従来の強化学習の持つ課題を解決する。
共同研究の成果イメージ
OISTの銅谷賢治教授の研究チームは、脳科学の観点から神経計算機構の数理モデル化を行い、強化学習アルゴリズムへの反映を行う。富士通研究所は、最適化、制御工学の観点からアルゴリズム考案に参加し、同時に、計算資源を最大限活用する実装手法を開発する。
具体的には、(1)動的に変化する大量データの中から強化学習に適した情報を自動的に抽出する技術、(2)過去の経験を別の問題の行動選択方策へと生かす転移学習技術、(3)複数の方策から状況に応じて行動を選択する協調・並列強化学習技術、の3つの分野で新技術を開発する。
今後は、2016年度中に、大量の入力情報への対応、環境変化へのフレキシブルな対応、保守的な対応など、複数の方策を並列に学習させ行動選択に生かすという課題に取り組む。