NVIDIAは米国時間9月13日、「Pascal」アーキテクチャをベースとするGPUアクセラレータ「Tesla P40」と「Tesla P4」を発表した。
NVIDIAのスペックシートを見ると、P40は帯域幅346GBps、24GバイトGDDR5メモリ、3840基の「CUDA」コアを搭載し、単精度で12TFLOPs、INT8命令で47TOPsの演算性能を実現している。下位モデルのP4は帯域幅192GBps、8GバイトGDDR5メモリ、2560基のCUDAコアを搭載し、単精度で5.5TFLOPs、INT8命令で22TOPsの演算性能を提供する。
人工知能とニューラルネットワークの実行用に設計されたP40は10月、P4は11月に提供が開始される予定だ。
同社によると、P40とP4はそれぞれ2015年に発表された「Tesla M40」「Tesla M4」の4倍のパフォーマンスを提供するという。2016年に発売されたIntelの「Xeon E5-2690 v4」を使用した場合と比較すると、NVIDIAの製品は40倍の電力効率、45倍の応答速度を提供するとしている。
「Tesla P4を1個搭載した1台のサーバは、動画を推論するワークロードの場合、13個のCPUのみを搭載したサーバと同等のパフォーマンスを発揮し、サーバや電力などにかかる総所有コストを8倍以上削減できる」(NVIDIA)
これらのハードウェアに加えて、NVIDIAは「TensorRT」ライブラリと「DeepStream」ソフトウェア開発キット(SDK)もリリースする。TensorRTは16ビットまたは32ビットで訓練されたニューラルネットワークを使い、精度を下げた8ビット演算向けに「最適化」する。一方、DeepStreamは最大93のHDビデオストリームをリアルタイムで同時に分析することを可能にする。
「(DeepStreamは)自動運転車、対話型ロボット、フィルタリング、広告表示などのアプリケーション向けに動画コンテンツを大きな規模で理解するという、AIにおける最大の課題の1つに対処する」(同社)
NVIDIAは5月、「GTX 1080」「GTX 1070」を発表した際にPascalアーキテクチャを披露した。1080はこれまでの最上位カード「TITAN X」の2倍のパフォーマンスと3倍の効率を提供するとNVIDIAの最高経営責任者(CEO)Jen-Hsun Huang氏は述べていた。
またNVIDIAは9月13日、「Drive PX 2」プラットフォームを発表した。同プラットフォームは、Baidu(百度)の自動運転車に搭載予定だという。PX 2は高速道路での自動運転やHDマッピングのほか、カメラやLiDAR(ライダー)、レーダー、超音波センサからの入力の処理も可能にするとNVIDIAは述べた。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。