音声のテキスト化にAIを活用した「Otter」アプリが登場--検索や共有機能も

Joan E. Solsman (CNET News) 翻訳校正: 湯本牧子 吉武稔夫 (ガリレオ)

2018-03-05 12:06

 AISenseが新たに開発した無料のモバイルアプリ「Otter Voice Meeting Notes」は、音声のテキスト化を、「Google Doc」で文字入力するのと同じくらい簡単で利用しやすいものにすることを目的としている。AISenseは、Googleや音声認識を手がけるNuanceなどで経験を積んだ人材が集まって設立された企業だ。

 先週開催されたMobile World Congress(MWC)2018で発表されたOtterは、音声のテキスト変換を無料かつ正確にするだけでなく、スマートにすることも目指している。

 Otterを使用する際には、マイクのアイコンをタップして録音を開始すると、話している内容のライブテキストが未加工の状態で瞬時に文字に起こされて表示されていく。Otterの人工知能(AI)が本領を発揮するのは、録音を終えた後だ。処理後、クリーンアップされたテキストは、交代で話したユーザーごとに区別される。Otterは登録プロセスの一環として、5つの段落からなる文章を読み上げるよう求めることで、ユーザーの「声紋」を取得する。ユーザーの音声を学習して、明確に識別するためだ。


提供:Mark Licea/CNET

 Otterの音声テキストは、1つのテキスト内だけでなく、保存したすべての録音から検索できる。自動的にキーワードが生成されるので、ユーザーはキーワードをタップして検索することが可能だ。Otterでチームを作成すれば、アプリから個々のユーザーやチームメンバーとコンテンツを共有できる。任意のユーザーに音声テキストへのリンクを送信して、ウェブ上で閲覧してもらうこともできる。

 素晴らしい機能の1つとして、録音を再生するとテキストと音声が同期されるので、テキストの任意の箇所をタップすると、音声はその箇所に即座にジャンプし、正しくテキスト化できているかどうかをすばやく確認できる。音声の再生中、アプリでは話している音声に合わせて単語の強調表示も行われる。

 米国時間2月26日に一般公開されたこのアプリは初期段階にあり、筆者が試したところ、若干のバグもみられた。

 以前に録音した会話をインポートできれば便利だが、現在のところそうした機能は無い。アプリとその基本的な音声テキストサービスは無料だが、AISenseは今後、Evernoteのビジネスモデルのように、無料サービスにはない機能を利用できるサブスクリプション制サービスを追加する計画だ。

 Otterのデータは機密扱いで、暗号化される。AISenseがOtterで広告ベースのビジネスを構築する予定はないという。

 同アプリは現在英語に対応し、「Android」「iOS」版が提供されている。ウェブでも一部機能が利用できる。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]