はじめに
前回に続いて、2021年に公開された論文「Warehouse-Scale Video Acceleration: Co-design and Deployment in the Wild」を元にして、Googleのデータセンターに導入されている、動画のトランスコーディング処理に特化した独自設計のハードウェアを紹介します。今回は、VCUの性能を示すベンチマークの結果を紹介します。
処理速度の比較
はじめに、トランスコーディング処理をCPU、GPU、VCUのそれぞれで実施した場合の処理速度の比較結果を示します。論文内では、次の4種類のシステムを用いて、vbenchと呼ばれる一般公開されたベンチマークツールを実行した結果が示されています。
(1) x86 Skylake CPU × 2を搭載したサーバー(メモリー容量384G)
(2) Nvidia T4 GPU × 4を搭載した2ソケットサーバー
(3) VCU × 20
(4) VCU × 8
(1)のシステムでは、すべての計算処理をCPUで行います。(2)のシステムでは、トランスコーディングに関わる処理はすべてGPUで実施します。(3)は1台のサーバーに10枚のVCUカードを接続したもので、前回の記事で説明したように、Googleのデータセンターで用いられている標準構成のサーバーになります。1枚のカードには、2個のVCUが搭載されている点に注意してください。また、(4)は、VCUカードを4枚に制限したものです。(2)がGPUカードを4枚使用しており、これとカードの枚数を揃えた構成になります。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。