NECと理化学研究所(理研)は、共同で人工知能(AI)を活用した画像認識において、新たな対象物を追加登録する際に必要となる学習データの作成作業を大幅に簡素化する技術を開発したと発表した。この技術の活用で、80種類の検知対象物を含む画像認識において学習データ作成時間を75%削減できることが確認された。
この技術は、AIの学習にあいまいな情報を活用する「弱ラベル学習」という技術を発展させ、AIを活用した画像認識に対象物を追加登録する時に問題となる学習データ作成の手間を削減する。弱ラベル学習は、「学習が不安定になり精度が低下する」という問題があるが、NECと理研は今回、弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを世界で初めて開発した。
新たな検知対象としてバイクを追加する場合の仕組み
従来技術との比較
弱ラベル学習は、AIを活用した画像認識の学習データにおいて、一部のみがラベル付けされ、それ以外の領域は何であるかがあいまいな「弱ラベル」が付与されたデータである――とみなして学習する手法。
例えば、トラックやバスなどの車両を認識するAIに、新たにバイクを学習させる場合、トラックやバス、背景に対してラベル付けをしないことは、それらが「バイクではない」という弱ラベルを付与したことに相当する。弱ラベル学習の手法により、バイクのみをラベル付けしたデータからでも学習可能となり、データ作成の作業工数を大幅に削減できる。
完全なラベルが付与されたデータを用いてモデルを学習する場合には、出力値が正解データに近付くようにモデルを最適化する。これに対して、弱ラベル学習では、弱ラベルに基づいてモデルの予測の正しさを逐次推定しながらモデルを最適化する。これによりラベルのあいまい性に起因して学習が不安定になり、高精度なモデルを学習できないという問題が知られていた。
今回開発された技術では、学習時の不安定性を解消するための補正を加えながら学習することで、この問題を解決した。一般に、学習時に補正を加えると、学習が安定する代わりに、本来の目的である「対象物を正しく推定するモデルを学習」できる保証がなくなるが、今回開発したアルゴリズムを利用することで、弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすことができる。