“総合格闘技”級に面倒くさい「WebRTC」のクラウド利用を促すNTT Comの秘策 - (page 2)

阿久津良和

2019-01-23 11:30

　無償トライアル提供開始時点でMedia Pipeline Factoryが利用できるコンポーネントは、音声をWAVE形式に変換してチャンクごとに区切ったデータをオブジェクトストレージに保存する「Filewrite」、前述したGoogle Speech APIを利用する「Recognizer」、同じく機械翻訳を行う「Translator」、さらに動作確認用のログを出力する「Logger」、RecognizerとTranslatorの結果をデータベースに保存する「Dbwriter」、同結果をGoogle Cloudに出力する「Publisher」の6種類。

　これらにNode.jsベースでコンポーネントを自由に作成するカスタムコンポーネントが加わる。これらをGUI上で分岐、連結する開発環境に合わせて展開する環境、各コンポーネントのログやヘルスチェック、メトリクスを確認する機能も用意する。

　「AIと組み合わせれば音声・画像認識や機械翻訳、SIP（Session Initiation Protocol Server）とならVoIPとWebRTCの相互連携、CDN（コンテンツ配信網）ならライブ配信などへも利用可能。また、カスタムコンテナを作成することで、低遅延ライブ配信やゲーム画面とプレイヤーの映像を合成した配信も不可能ではない」（大津谷氏）

　現時点での実証実験パートナーは10社以上におよび、前述したレアジョブ以外には、オンライン治療、プロスポーツ、在京キー局、フリマアプリ、ライドシェアなど各業界関係企業が名を連ねる。

　Media Pipeline Factoryは今後も機能拡張を続けるが、リーン＆アジャイルの姿勢は維持しつつ、各クラウドベンダーが提供するAPIのバージョンアップへは追従することを表明。また、機能拡張の優先順位についても「共同トライアルで顧客の意見を聞きながら、需要が高いものを実装していく」（大津谷氏）