NECは7月24日、コンタクトセンターでの電話応対時に、オペレーターと顧客 が話す内容をリアルタイムで文書化する音声認識ソフト「CSVIEW/VisualVoice(シーエスビュー/ビジュアルボイス) V2.1」を発売したと発表した。10月1日から出荷を開始し、今後3年で100システムの販売を目指す。
「VisualVoice」は、独自の音声認識エンジンや照合アルゴリズムなどを採 用し、自然な会話をリアルタイム・高精度に認識が可能。事前に登録したキー ワードを通話から検出し管理者に知らせたり、関連するFAQ(頻繁に尋ねられ る質問)を表示する機能も搭載する。これまでは、会話の訓練を受けて広帯域 マイクを使用しているオペレーターの通話内容のみテキスト化が可能だった。
NECでは統計的手法に基づき音声と雑音を高精度に区別する「モデルベース 音声検出」、話者の声の違いを自動的に捉え声の特徴に合わせ音声認識を行う 「特徴量正規化/話者適応」といった昨日を盛り込むことで、国内で初めて顧 客の通話内容のテキスト化にも対応できるようした。
税別価格は、オペレータと顧客の音声をリアルタイムに文字化する「VisualVoice V2.1オペレータ支援」と、特定ワード検知と通話検索などの「VisualVoice V2.1 スーパーバイザー支援」が400万円から、オペレータ支援とスーパー バイザー支援のセット「VisualVoice V2.1 コンタクトセンター支援」が600万 円から。
同時に、各コンタクトセンターに適した音声データ収録や言語モデルの作成 などを行う「言語モデル構築サービス」も販売する。税別価格は600万円から。