NTTコミュニケーションズ(NTT com)は1月23日、「WebRTC(Web Real-Time Communication)」の開発・活用プラットフォームである「Enterprise Cloud WebRTC Platform SkyWay」の機能をノンコーディングで拡張できるキット「Media Pipeline Factory」の無料トライアルの提供を開始した。
Media Pipeline FactoryはSkyWayの音声や映像のデータを音声認識や機械翻訳などのクラウドサービスとリアルタイムで連携できるように機能を拡張できる。WebRTCはウェブブラウザで音声や映像をリアルタイムにやり取りするためのAPIの定義。
「WebRTCはSkypeとできることは一緒だが、インストールなどは不要。(Media Pipeline Factoryで)すべてのエンジニアがWebRTCを扱える『民主化』を目指す」(NTT com 技術開発部 Webコアテクニカルユニットリーダ 担当課長 大津谷亮祐氏)と語る。
NTT com 技術開発部 Webコアテクニカルユニットリーダ 担当課長 大津谷亮祐氏
SkyWayはWebRTCに必要なサーバをNTT Comが構築、運用して、ソフトウェアの開発環境をユーザー企業に提供するサービス。NTT comは2013年12月から無償トライアル版SkyWayを提供し、利用者のビジネス利用が広まったことを理由に、2017年9月から正式サービスを開始している。現在はグローバルで5200におよぶアプリで利用され、SkyWay開発者は5000人を超える。
利用例としてはレアジョブのオンライン英会話サービスやメドレーのオンライン診断アプリ、品川区立中学校の英語授業など多岐にわたる。SkyWayが誕生した背景には、WebRTCの難解さにあると同社は説明する。
大津谷氏はとあるエンジニアをツイートを引用し、「WebRTCを使うには、プロトコルやネットワーク、サーバ構築などを身に付ける『総合格闘技問題』を解決しなければならない。エンジニアの『面倒くさい』を引き受ける」のがSkyWayの存在だ。
だが、SkyWayにはいくつかの課題がある。
SkyWay API経由で通話相手とのマッチングなどを行うものの、ウェブブラウザやiOS&Android以外のデバイスでは使用できない。そのため、2018年6月には「WebRTC Gateway」を発表。監視カメラや組込機器などに代表されるIoTデバイスでWebRTCを利用可能としている。
ワンボードマイコンでもWebRTCが利用できる
また、WebRTCはマッチングを終えると、パケットは通話者同士のデバイスへ直接送受信するため、クラウドに映像と音声を保存(録画、録音)して、人工知能(AI)などによる処理ができなかった。この課題を解決したのがMedia Pipeline Factoryである。同社によればIoTデバイスやクラウドへの対応は世界初だという。
Media Pipeline FactoryはNTT comのクラウド上で動作し、GUIによる開発環境で同社製自然言語解析APIである「COTOHA Virtual Assistant」を筆頭に、Googleの各サービスAPIや「Amazon S3」などのストレージサービスを用途に応じて組み合わせ、SkyWayを拡張するというもの。
デモンストレーションでは、パイプライン処理でテンプレートを作成して音声をリアルタイムで自動翻訳するボイスレコーダーを披露した。具体的にはWebRTC Gatewayで圧縮データを伸張し、「Google Speech API」でテキスト化、「Google Translate API」で英語に翻訳して、その結果を「Amazon DynamoDB」に格納した。同時にWebRTCの音声データはAmazon S3に保存することで一連の処理を実現している。