NECは、独自の音声認識技術を活用したデジタルトランスフォーメーション(DX)支援サービス「NEC Enhanced Speech Analysis 高性能音声解析」を開発したと発表した。同社クラウド基盤上で文字データ化した音声認識結果を返送し、さまざまな現場業務のDX化を支援する「APIサービス」と、ウェブ会議の音声をリアルタイムに文字データ化し出力可能な「Meeting Assistant」を提供する。
これらのサービスは、最新の深層学習技術を活用した同社独自の音声認識技術を利用し、従来は実用化が難しかった自由な会話内容の高い認識精度と耐騒音性、また複数の人の会話でも発言ごとに話者を識別できるのが特徴。2月に行った社内実証で自由会話の認識精度が平均94%だったといい、従来製品に比べ10%以上高いとする。
「NEC Enhanced Speech Analysis - 高性能音声解析 -」の特徴
「APIサービス」版は、騒音の多い屋外環境での識別にも強く、建設現場や工場設備などでの現場報告作業などを効率化をできるという。「Meeting Assistant」版は、文字データ化時に発話者の名前も自動的に付記できる。また、発話内容を文字データに変換して同形式で出力可能。これにより議事録の作成に要する時間を大幅に削減し、会議の開始時に議事録タイトルや出席者などの情報を登録して、過去の議事録を一覧形式で管理できる。
「Meeting Assistant」画面イメージ
同社は、これらのサービスを活用し、例えば建設現場では点検記録や報告書の作成を自動化し、営業や窓口業務では契約時の重要事項説明を行った記録、コールセンター業務では、顧客対応時のメモの自動作成などが実現すると説明する。また、文字データの分析技術などを組み合わせて、会話の内容を要約したりや使用すべきではない単語の自動検出、契約時における証跡の作成も可能とする。
サービス利用料は、「APIサービス」版が10時間当たり900円から、「Meeting Assistant」版が同3000円からになる。