野村證券は、全国約160ヵ所の営業店や本社で利用する約2万6000台分の電話機の通話録音データを自動でテキスト変換するシステムを構築した。顧客への応対品質向上と通話モニタリングの効率化を支援する。システム構築を支援した日立製作所が12月18日に発表した。
日立の音声認識基盤「Speech Recognition Platform」を活用。深層学習技術を利用した音声認識エンジンを搭載し、さまざまな雑音が混ざる通話環境においても高い認識率を実現するという。日々の膨大な録音データをバッチ処理でテキストに変換し、データ処理基盤であるApache Hadoopで蓄積する。
また、声の大きさや速度、話者間のかぶり、会話の間といった非言語情報を抽出・定量化する機能も備え、テキスト化される言語情報以外からも会話の状況や特徴を捉えることができる。
日立情報通信エンジニアリング製の通話録音システム「Recware III」と音声認識基盤をシームレスに連係し、通話録音データとテキスト変換されたデータをひも付けることで、両データを同一画面上で一覧表示して操作可能。確認したい通話音声をキーワード検索で簡単に絞り込み・特定できるため、通話内容の確認作業を効率化できる。
システム概要図(出典:日立製作所)