NTT Comは、企業向けに顧客との通話内容を高精度にテキスト化するサービス「COTOHA Voice Insight」の提供を開始した。
同サービスは、コンタクトセンターでの通話の録音ファイルを専有型のセキュアなクラウド上にアップロードすることで、通話内容をテキストファイルに一括変換することができる。テキスト化したデータの活用イメージを体感するための試し機能として、可視化ツールを無償提供する。
サービス提供イメージ
変換したデータは、活用しやすいCSV形式でのダウンロードが可能。音声認識には、日本語の発話内容(音声データ)を高精度で認識し、テキストデータに置き換えることができる「COTOHA API」を活用している。「COTOHA API」は、NTT Comが2018年9月より提供している、人工知能(AI)による自然言語解析APIとなる。
人間の声を深層学習によって精緻に分析できるほか、雑音に強い独自の音響モデルと発話区間検出技術により、世界最高水準の認識率を実現したという。また、音声認識APIは、コンタクトセンター向けのチューニングを実施しているため、コンタクトセンター内の業務でよく使われる単語を正確に認識することができるとする。
ユーザー辞書は最大5000語まで登録できる。商品名やサービス名などの単語を、管理画面から簡単に登録でき、さらにクラウドのサーバーへの接続もインターネットではなく企業向けの閉域網接続のみで行い、ネットワークのセキュリティを確保する。
利用料金(税別)は、初期費用が10万円、月額利用料が25万円から。別途、NTT Comの企業向けVPNサービス「Arcstar Universal One」の契約が必要になる。