新エネルギー・産業技術総合開発機構(NEDO)と沖電気工業(OKI)は、ディープラーニング(深層学習)モデルにおいて、認識性能を維持しつつ、メモリー使用量や消費電力を低減する新たなモデル軽量化技術を開発したと発表した。これにより、既存のベンチマークとされる高精度モデルに対し、認識精度の劣化を約1%に抑えつつ、演算量を約80%削減できる。
今回開発した軽量化技術では、モデル構造の多様性を考慮した新しいアーキテクチャーによって重要なチャネルを自動選択することで、認識性能を維持しつつ、演算量を大幅に削減できるようにしている。OKI独自のチャネル・プルーニング技術「PCAS(Pruning Channels with Attention Statics)」を発展させ、多様な分岐・合流経路を含むモデルに柔軟に対応できるアーキテクチャーにした。チャネル・プルーニングとは、演算結果を保持するニューロンの集まりであるチャネルに対し、ニューラルネットワークの中で冗長なニューロンを削減し、それに関わる係数や演算を削減する技術。
ディープラーニングモデル内の分岐経路では、経路ごとに認識性能に寄与する重要なチャネルが異なるため、その差異を吸収する必要がある。そこで、分岐部で単一のチャネルに対して複数のアテンション・モジュールを導入することにより、複数経路のチャネルの重要度を全体最適で推定できるようにした。アテンションとは、主に画像認識や自然言語認識などで、認識に重要な情報に着目するための手法として開発されてきたニューラルネットワーク技術を指す。
今回開発したモデル軽量化技術
人工知能処理のアルゴリズムとしてクラウド上で多く活用されているディープラーニングは、多層化により認識性能を向上させることが多い。しかし、演算量・パラメーターが多くなり、大量の演算リソースや電力が必要となる。そのため車載用途やスマートフォン、組み込みIoTデバイスなど多様なエッジデバイスで活用するためには、限られた演算リソース上でも高性能なモデルを高速・省電力に実行できるモデルの軽量化技術が求められていた。
NEDOとOKIは今後、今回開発した軽量化技術を低ビット演算環境にも適用し、さらなる高度化と高効率化に取り組む。また大規模な認識モデルへの適用にも取り組み、高度な人工知能を軽量かつ省電力に実行できる技術の確立を目指す。