NVIDIA、PascalベースのGPU「Tesla P40/P4」を発表--ディープラーニング向け

Chris Duckett （ZDNET.com）翻訳校正：編集部

2016-09-14 12:53

　NVIDIAは米国時間9月13日、「Pascal」アーキテクチャをベースとするGPUアクセラレータ「Tesla P40」と「Tesla P4」を発表した。

　NVIDIAのスペックシートを見ると、P40は帯域幅346GBps、24GバイトGDDR5メモリ、3840基の「CUDA」コアを搭載し、単精度で12TFLOPs、INT8命令で47TOPsの演算性能を実現している。下位モデルのP4は帯域幅192GBps、8GバイトGDDR5メモリ、2560基のCUDAコアを搭載し、単精度で5.5TFLOPs、INT8命令で22TOPsの演算性能を提供する。

　人工知能とニューラルネットワークの実行用に設計されたP40は10月、P4は11月に提供が開始される予定だ。

　同社によると、P40とP4はそれぞれ2015年に発表された「Tesla M40」「Tesla M4」の4倍のパフォーマンスを提供するという。2016年に発売されたIntelの「Xeon E5-2690 v4」を使用した場合と比較すると、NVIDIAの製品は40倍の電力効率、45倍の応答速度を提供するとしている。

　「Tesla P4を1個搭載した1台のサーバは、動画を推論するワークロードの場合、13個のCPUのみを搭載したサーバと同等のパフォーマンスを発揮し、サーバや電力などにかかる総所有コストを8倍以上削減できる」（NVIDIA）

　これらのハードウェアに加えて、NVIDIAは「TensorRT」ライブラリと「DeepStream」ソフトウェア開発キット（SDK）もリリースする。TensorRTは16ビットまたは32ビットで訓練されたニューラルネットワークを使い、精度を下げた8ビット演算向けに「最適化」する。一方、DeepStreamは最大93のHDビデオストリームをリアルタイムで同時に分析することを可能にする。

　「（DeepStreamは）自動運転車、対話型ロボット、フィルタリング、広告表示などのアプリケーション向けに動画コンテンツを大きな規模で理解するという、AIにおける最大の課題の1つに対処する」（同社）

　NVIDIAは5月、「GTX 1080」「GTX 1070」を発表した際にPascalアーキテクチャを披露した。1080はこれまでの最上位カード「TITAN X」の2倍のパフォーマンスと3倍の効率を提供するとNVIDIAの最高経営責任者（CEO）Jen-Hsun Huang氏は述べていた。

　またNVIDIAは9月13日、「Drive PX 2」プラットフォームを発表した。同プラットフォームは、Baidu（百度）の自動運転車に搭載予定だという。PX 2は高速道路での自動運転やHDマッピングのほか、カメラやLiDAR（ライダー）、レーダー、超音波センサからの入力の処理も可能にするとNVIDIAは述べた。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。