無償トライアル提供開始時点でMedia Pipeline Factoryが利用できるコンポーネントは、音声をWAVE形式に変換してチャンクごとに区切ったデータをオブジェクトストレージに保存する「Filewrite」、前述したGoogle Speech APIを利用する「Recognizer」、同じく機械翻訳を行う「Translator」、さらに動作確認用のログを出力する「Logger」、RecognizerとTranslatorの結果をデータベースに保存する「Dbwriter」、同結果をGoogle Cloudに出力する「Publisher」の6種類。
これらにNode.jsベースでコンポーネントを自由に作成するカスタムコンポーネントが加わる。これらをGUI上で分岐、連結する開発環境に合わせて展開する環境、各コンポーネントのログやヘルスチェック、メトリクスを確認する機能も用意する。
「AIと組み合わせれば音声・画像認識や機械翻訳、SIP(Session Initiation Protocol Server)とならVoIPとWebRTCの相互連携、CDN(コンテンツ配信網)ならライブ配信などへも利用可能。また、カスタムコンテナを作成することで、低遅延ライブ配信やゲーム画面とプレイヤーの映像を合成した配信も不可能ではない」(大津谷氏)
現時点での実証実験パートナーは10社以上におよび、前述したレアジョブ以外には、オンライン治療、プロスポーツ、在京キー局、フリマアプリ、ライドシェアなど各業界関係企業が名を連ねる。
Media Pipeline Factoryは今後も機能拡張を続けるが、リーン&アジャイルの姿勢は維持しつつ、各クラウドベンダーが提供するAPIのバージョンアップへは追従することを表明。また、機能拡張の優先順位についても「共同トライアルで顧客の意見を聞きながら、需要が高いものを実装していく」(大津谷氏)
Media Pipeline Factoryのデモンストレーション