NECは日本テレビ放送網と共に、同局の生放送番組「ストレイトニュース」で自動で字幕を付与する実証を5月末に行った。
同実証は、NEC独自のAI音声認識技術を活用したDX支援サービス「NEC Enhanced Speech Analysis-高性能音声解析-」が用いられ、音声認識モデルに放送用語を事前に学習させることで、認識精度99.0%という高い精度を確認した。同社の従来の音声認識サービスでは認識精度が91.6%となっており、放送業界向けに特化したことで7.4ポイントの精度向上を実現した。
字幕を自動付与する画面
またNECは、耐騒音性が求められるスポーツ中継などでの活用を視野に、周囲の雑音やBGMによる誤認識を低減するための技術を開発した。NEC社内における実証では電車内騒音や野外騒音などの騒音が加わった状態でも、一般的に騒音下で利用されている音声認識と比較し最大15.9ポイント高い88.3%の認識精度を確認している。
日本テレビによると、収録番組への字幕付与は字幕の内容の正確性を確保するための運用負荷が高く、生放送に対する字幕については限られた番組のみの運用となっていたという。今後、正確で効率的な運用や自動化を進めるには高い認識精度と処理速度が必要となるが、日本テレビでは、今回の実証技術は生放送に活用できる技術だと評価している。