人工知能(AI)を活用した音声テキスト変換を手掛けるOtter.aiは、ビデオ会議やウェビナーにリアルタイムでライブキャプションを付加できる新機能を発表した。Zoomで利用可能になる。
これで、営業チームが発表した数字を誤って報告したり、上司が提示した目標リストを見落としたりすることはなくなるかもしれない。
この新機能は特に、アクセシビリティのニーズがあるユーザーや、英語が母国語でないため、会議で文章の意味を理解することに苦労するユーザーにとって有用だろう。Otter.aiは現在、英語のみサポートしているが、アメリカ南部、インド、スコットランドを含む英国、中国、欧州各国の人々が話す、さまざまなアクセントの英語に対応している。
Otter.aiは、人気が高まりつつある音声テキスト変換分野の新参者というわけではない。同社は2018年に、「Android」と「iOS」向けアプリを発表して注目を集めた。話されている内容をとらえて書き起こすツールで、講演、会議、インタビューなどで、スマートなメモ取りのアシスタントのように使用できる。
同社の技術は、モバイルアプリやウェブベースのツールとして利用可能で、同社はオンライン会議のサポートも開始しており、Zoomがクラウドに録音した会話の内容を書き起こし、オンライン会議の記録を残すことができるオプションを提供している。
またOtter.aiは2020年春に、「Live Notes」という新機能を発表した。ユーザーはビデオ会議中にライブの文字起こしの機能を別の共有ファイルで開くことができる。発言内容がリアルタイムで書き起こされる。
Zoomのライブキャプションは、Live Notesに続くものだ。Zoomのオンライン会議中に、書き起こしたテキストを直接プラットフォームに組み入れる。Otter.ai創業者のSam Liang氏は米ZDNetに対し、「これでLive Notesをバックグラウンドで実行させながら、通話中にキャプションを表示できるようになる。この機能は、幅広いユーザーに役立つはずだ」と述べた。
「聴覚障害者だけでなく、世界各地で分散して業務を行う、英語を母国語としない人々にとっても大きな助けとなる。また教育分野でも、後で戻って学習できるLive Notesに加え、オンライン授業で学習を円滑に進める上で、キャプションのメリットを得られるだろう」(同氏)
書き起こしは、必ずしも完璧というわけではないかもしれない。しかし、特にこのツールは使いやすく、アクセスしやすいものであり、Otter.aiのアルゴリズムは、オンラインのレビューやユーザー体験による評価でもみられるように、かなり正確なようだ。
ユーザーの利用が拡大し、さらなる文字起こしのアルゴリズムの訓練データが提供されるとともに、AIがバックグラウンドノイズや強いアクセントを克服できるようになるにつれ、このテクノロジーの精度は向上しているとLiang氏は考えている。
Liang氏は、Googleで「Googleマップ」のロケーションプラットフォームなどを率いていた経歴を持ち、位置特定技術などで特許を有している。
またOtter.aiは現在、「Microsoft Teams」「Google Meet」「Cisco Webex」などのプラットフォームとスムーズに連携し、文字起こしやライブキャプション機能を提供できるよう取り組んでいるとLiang氏は認めた。
Zoomのライブキャプション機能は、Otter.aiの「Business」プランのユーザーと「Zoom Pro」のユーザーが利用できる。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。