NECは8月19日、従来技術の半分の学習データ量でも高精度に識別可能なディープラーニング技術を開発したと発表した。
同技術は、ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別が難しい学習データを集中的に人工生成する。これにより、ディープラーニング技術の適用に必要な学習データ量を半分程度に削減でき、システムの開発期間短縮できる。また、データの種類を問わず汎用的に適用可能であることから、専門家による調整が不要になり、従来、学習データ収集時間やコストの高さが阻害要因となっていた製品の外観検査やインフラ保全など、さまざまなシステムの早期立ち上げを可能にする。
従来技術との違い(出典:NEC)
学習データの削減については、従来技術では、ニューラルネットワークに入力する前にデータを意図的に加工・変形させ、学習データ量を人工的に増やしていたのに対し、ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別が失敗しやすい「苦手な学習データ」を集中的に人工生成できるようになった。NECでは、公開データベース(手書き数字認識:MNIST、物体認識:CIFAR-10)にて評価し、学習データ量が半分でも従来技術と精度が変わらないことを確認している。
専門家の調整作業については、従来のデータ拡張では、データの種類ごとにデータの生成方法を変える必要があり、例えば、画像では大きさや回転角度など、音声では声の高さや話す速さなどを変えることでデータを人工的に増やしていた。さらに、専門家がデータ生成方法を慎重に選び、学習に悪影響を及ぼすデータが発生しないよう調整していた。しかし今回開発した技術では、ニューラルネットワーク内部の数値に基づいて自動的に学習データを生成するため、多様なデータに対して汎用的かつ効率良く適用することができ、専門家による調整を不要になる。