富士通とマサチューセッツ工科大学 Center for Brains, Minds and Machines(CBMM)は、学習時と傾向の大きく異なる未知(out-of-distribution:OOD)データに対しても、人工知能(AI)が高い認識精度を示す技術を開発した。CBMMは、アメリカ国立科学財団の資金提供を受けて2013年に設立された知能に関する学際的な研究を行う機関横断センター。この技術を適用したAIを画像認識精度を測る標準ベンチマーク「CLEVR-CoGenT」で評価した結果、世界一の精度を達成したという。
近年、AIはディープニューラルネットワーク(DNN)の登場により、人と同等以上の性能を発揮する一方で、学習時には想定していなかった照明や視点などの環境や条件の変化により見え方に大きな違いが生じると、認識精度が大幅に低下するという課題があった。
開発した技術は、人の認知特性と脳の構造に着想を得て、DNNを形や色といった属性ごとのモジュールに分割して学習させることで、AIがOODデータを高精度に認識できるという。この技術の活用により、さまざまな観測条件の変化に対応できる交通監視AIや、多種多様な病変を正しく認識できる画像診断AIなどの実現が期待される。
同技術は、人が物を認知する際に形や色などの見え方に違いがあっても、それらの視覚情報を脳内で正確に捉えて分類できることに着目して開発された。複数の画像データをDNNに入力した際に生じるニューロンにおける対象物の見え方と分類の反応から独自の指標を算出し、この指標の数値が高くなるようにDNNの学習を促進させることで、AIの認識精度を向上させる。
従来、DNNを分割せず一つのモジュールで学習させることが認識精度の高いAIを実現する最良の手法だと考えられていたが、今回算出した指標に基づきDNNを物の形や色などの属性ごとのモジュールに分割して学習させることで、より認識精度が高いAIを開発できた。