日本生命保険は、日立製作所の「音声書き起こし支援サービス」を導入する。2019年度上期に日本生命の複数の部署の会議を対象に、同サービスの試用・評価検証を行い、会議議事録の作成時間縮減や正確性向上の効果などを確認できた。
日本生命は同サービスを使って、マイク1台あたり最大8名の発話を話者ごとに識別・分離してテキスト化することに成功した。
同サービスでは、日立独自の音源分離技術を活用し、1つの会議室に複数のマイクを設置することで多人数の音声認識を実現する。音源分離技術を活用することにより、音源の音の到来方向を立体的に検知し、話者以外からの雑音を除去し目的の音声のみを抽出することが可能となる。また、同じ音声を複数のマイクで採取した場合は、各マイクの認識結果で最も精度が高いテキストを判定して出力する。
マイク設置イメージ(出典:日立製作所)
さらに同サービスでは、音声認識基盤上に一般用語集に加えてユーザー自身がカスタマイズ可能な辞書を用意している。これにより、専門性の高い業務でも、ユーザー自身がカスタマイズ可能な辞書に用語を登録することで社内用語や略称などの認識ができ、認識精度の継続的な向上を図れる。またクラウドサービスで提供しているため、電話・窓口・渉外先の対応といった利用シーンに合わせた柔軟な適用が可能だ。
利用シーンに適した方法を選択
入力可能な音源として、音声ファイル(wav、mp3)、電話音声、汎用マイクなど利用シーンに適した方法を選択できる。また、用途に応じた辞書を整備すれば、社内用語や製品名・略称を認識でき、社内で共通の辞書を作る、業務単位に最適化した辞書を作る、といった辞書の使い分けも可能。