日立製作所は、周囲の雑音に影響されず音に基づいて高精度に状況を認識することができる人工知能(AI)技術を開発したと発表した。今後はさらなる機能向上などを図り、熟練者の経験に頼らず、工場内などさまざまな設備に囲まれた環境に適用可能な、音に基づく自動設備診断の実用化を目指す。
センサを使わない音を利用した設備点検では、これまで熟練者が音を聞いて経験に基づく設備の稼働状態を診断する方法が一般的だった。昨今は熟練者不足などにより、自動診断サービスのニーズが高まっているが、工場内などさまざまな設備に囲まれた環境では、環境音や反響音など多様な種類の雑音が混在しているため、音に基づく正確な状況認識が難しく、設備の稼働状態を高精度に把握することが困難だった。
同技術では、まず複数のマイクロホンで音を録音し、マイクロホン間での音が到達する時間差から推定される音源の方向や、音色の違いから推測される反響音かどうかなどの複数の観点に基づいて、雑音が混ざった音を分解する。さらに、複数のディープニューラルネットワーク(DNN)に分解した音をそれぞれ入力し、設備や人などが置かれている状況と一致する可能性(確率)、それぞれ計算し、最後にその計算結果の多数決により、総合的な状況認識結果を出力する。複数のDNNの多数決による結果を確認することで雑音に影響されにくくなり、多様な種類の雑音が存在する環境でも高精度な状況認識が可能になる。
音の分解と複数の DNN を用いた総合判断による状況認識のプロセス
同技術は、音響認識分野で最大の国際コンペティション「DCASE 2018 Challenge」のTask5において第1位のスコアを獲得した。Task5は、家に設置した複数のマイクロホンを用いて収録された音のデータから「料理中」「食事中」「仕事中」「会話中」「テレビ視聴中」などの9カテゴリの日常活動のいずれの状況かを認識するタスクとなっている。