新型コロナウイルス感染症の世界的流行(パンデミック)下でのビデオ会議では、子供の叫び声や犬の鳴き声などが聞こえてくるのは、よくあることだ。
大手テクノロジー企業各社は、人工知能(AI)を使用してそれらの避けられないバックグラウンドノイズを遮断することで、そうした在宅勤務の現実に対処しようと試みている。
「Microsoft Teams」のビデオ会議で、AIを利用したノイズ抑制機能がついに利用可能になった。この機能は、最初の発表から既にかなりの時間が経過している。Microsoftは3月、このテクノロジーを発表し、ポテトチップスの袋を開ける音を抑制するデモを披露した。デモでは、ポテトチップスを食べるときの音が完全に抑制されていたが、話者の声ははっきりと聞き取れた。10月には、この機能が11月までにTeamsに提供されることが明らかにされた。
11月は過ぎ去ったが、クリスマスには間に合ったため、キッチンやラウンジ、即席の学習室からビデオ会議をしている人は、この機能のメリットを得られるだろう。
Microsoftは、「通話や会議中に、当社のAIベースのノイズ抑制オプションで、余計なバックグラウンドノイズを排除できるようになることを発表できてうれしく思う」としている。
Teamsユーザーは、ビデオ通話を開始する前に、デスクトップアプリの画面右上にあるユーザーアイコンをクリックして、アプリの「Settings」(設定)に移動する必要がある。「Settings」(設定)メニューから「Devices」(デバイス)を選択すると、「Noise Suppression」(ノイズ抑制)オプションが表示されるはずだ。現在のところ、この機能は「Windows 10」のTeamsでのみサポートされている。
「高」ノイズ抑制機能の狙いは、音声以外の全てのバックグラウンドノイズを遮断することにある。デフォルトの「自動」設定により、アプリはローカルノイズに基づいて最適な抑制レベルを判断することができる。デスクトップでノイズ抑制を有効にする手順は、この機能に関するMicrosoftのサポートページに記載されている。
幾つかの制限もある。PCのCPUは、Intelの「Advanced Vector Extensions 2」(AVX2)をサポートしている必要がある。また、会議や通話が録音されている場合や、ライブキャプションがオンになっている場合、ノイズ抑制機能は利用できない。この機能を有効にすると、より多くのCPUリソースが消費される。
CPUリソースの消費量が増えるのは、この機能がユーザーのオーディオフィードを分析し、ディープニューラルネットワークを使用して音声をノイズから分離しているためだ。
Microsoftは、「従来のノイズ抑制アルゴリズムは、一定のファンのノイズなどの単純な定常雑音のノイズ源のみに対応できるが、当社のAIベースのアプローチは、会話と不要なノイズの違いを学習し、キーボードの入力や食品包装紙のぐしゃぐしゃする音などさまざまな非定常雑音を抑制できる」と説明している。
Ciscoは8月、AIを用いて人の声と不要なノイズを識別し、会議で不要なノイズを除去する技術を提供するBabbleLabsを買収すると発表した。12月に入り、この機能を「Webex」で提供開始した。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。