AIで文字起こしや翻訳をする議事メモ作成サポート--NTT Comが開発

渡邉利和 2019年04月01日 12時13分

  • このエントリーをはてなブックマークに追加
  • 印刷

 NTTコミュニケーションズは3月29日、AI(人工知能)が自動で文字起こしや翻訳を行う議事メモ作成サポートサービス「COTOHA Meeting Assist」を4月1日から提供すると発表した。同社が以前から提供している自然言語解析技術を活用したAIサービス「COTOHA」シリーズの新サービスと位置付けられるクラウドサービスで、音声を文字に変換する「音声認識API」や「翻訳」などは既存のCOTOHA APIで提供されている機能を別途契約して組み合わせて利用する形となる。

NTTコミュニケーションズ アプリケーション&コンテンツサービス部 AI推進室長の三竹保宏氏
NTTコミュニケーションズ アプリケーション&コンテンツサービス部 AI推進室長の三竹保宏氏

 概要を説明したアプリケーション&コンテンツサービス部 AI推進室長の三竹保宏氏は、NTTは元々電話サービスから事業を開始しており、当初から日本語を取り扱ってきた長い歴史があるとして、同社の「COTOHA」シリーズが特に日本語処理に強いことを強調した。

 COTOHA Meeting Assistは、クラウド上に仮想的なミーティングルームを作り、そこに参加者がそれぞれログインして会話するという形で利用する。各人の発言内容はリアルタイムにテキスト化され、画面上に文字として表示される上、対応している言語であれば翻訳も可能とする。

COTOHAシリーズの進化
COTOHAシリーズの進化

 例えば、英語で発言された内容を日本語で画面表示することもリアルタイムに行える。従来であれば、語学力に秀でた人が時間を掛けて音声の文字化や翻訳を行っていたのに対し、自動でほぼ瞬時にテキストが得られるため、出力をチェックして間違いを修正するだけで良いなど、大幅な省力化/効率化が実現される。

 ただし、同社自身が“議事メモ作成サポートサービス”とうたっている通り、全自動で完全な議事録が作成できるというものではなく、「会議に出席して内容を理解している人がチェックして間違いを修正することを想定している」(三竹氏)となる。また、中核機能である音声認識や翻訳は別途COTOHA APIとして提供されているものを使っており、「COTOHA Meeting Assist」で新たに提供されるのは基本的には仮想ミーティングルームの機能だと考えて良い。COTOHA APIを活用することでどのようなソリューションが実現可能なのか、同社自身が具体的なユースケースとして提案したものと位置づけることもできるだろう。

 現時点での音声認識精度の限界から、基本的な利用環境としては「発言者が個々に独立したマイクを利用する」「ヘッドセットやイヤホンマイクなど、音声のみを明瞭に録音できるマイクを利用する」ことが想定されている。逆に言えば、一般的な会議室の中央にICレコーダーを置いて全員の発言を録音すると言った形では、各人の発言を明確に分離できなかったり、背景ノイズから発言部分を抽出する処理が上手くいかなかったりといった理由から、認識精度が大幅に下がってしまうという。

COTOHA Meeting Assistのデモ画面。英語と日本語で会議をしているところで、画面は日本人参加者が見ている画面。発言がリアルタイムでテキスト化されていく。「営業部 Ryan」氏の発言は実際は英語だが、画面上には日本語に翻訳された結果が表示され、SFなどでよく見かける「自動翻訳装置」が実現したかのようなイメージになっている
COTOHA Meeting Assistのデモ画面。英語と日本語で会議をしているところで、画面は日本人参加者が見ている画面。発言がリアルタイムでテキスト化されていく。「営業部 Ryan」氏の発言は実際は英語だが、画面上には日本語に翻訳された結果が表示され、SFなどでよく見かける「自動翻訳装置」が実現したかのようなイメージになっている
翻訳前の音声認識結果を表示したところ。日本語の処理に強いというだけあり、日本語の発言については正確にテキスト化できているが、英語の方はセンテンス末尾の音を取りこぼす傾向が見られた。今後さらに精度が向上していくことが期待されるが、現状ではある程度の修正作業は不可欠だろう。ただし、ほぼ正確な文字起こしがリアルタイムにでき来上がることによる省力化の効果は現時点でかなり大きいことが理解できた
翻訳前の音声認識結果を表示したところ。日本語の処理に強いというだけあり、日本語の発言については正確にテキスト化できているが、英語の方はセンテンス末尾の音を取りこぼす傾向が見られた。今後さらに精度が向上していくことが期待されるが、現状ではある程度の修正作業は不可欠だろう。ただし、ほぼ正確な文字起こしがリアルタイムにでき来上がることによる省力化の効果は現時点でかなり大きいことが理解できた

 その点、COTOHA Meeting Assistはオンラインの仮想ミーティングルームなので、ここにアクセスする時点で参加者はそれぞれ自分のPCからリモートでアクセスしていることがほぼ確実であり、PC経由の音声コミュニケーションということでヘッドセットなどを利用していることも想定される。リモートからの多言語コミュニケーションをサポートできるという点で働き方改革などに寄与できるサービスであると同時に、COTOHA APIの現時点で実現された機能を活用するためのサンプルアプリケーションとして、COTOHA APIの能力を最大限に引き出せる利用環境が自然に利用できるような形で実装されていると見てよさそうだ。

 利用料金は、基本契約が月額3万5000円で、オプションでCPU、メモリ、ストレージなどを追加可能。なお、音声認識APIや翻訳APIは別途契約が必要でこちらは従量制課金となる。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

連載

CIO
月刊 Windows 10移行の心・技・体
ITアナリストが知る日本企業の「ITの盲点」
シェアリングエコノミーの衝撃
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「展望2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
セキュリティインシデント対応の現場
エンドポイントセキュリティの4つの「基礎」
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
エンタープライズAIの隆盛
インシュアテックで変わる保険業界
顧客は勝手に育たない--MAツール導入の心得
「ひとり情シス」の本当のところ
ざっくり解決!SNS担当者お悩み相談室
生産性向上に効くビジネスITツール最前線
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell Technologies World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]