Amazon Web Services(AWS)は米国時間11月29日、GPUベースのワークロード向けの「Graviton2」プロセッサー搭載インスタンスを含む、複数の「Amazon Elastic Compute Cloud」(Amazon EC2)インスタンスの一般提供を開始したと発表した。新たな「G5g」インスタンスファミリーは、Amazonが独自に開発したGraviton2に加え、NVIDIAの「NVIDIA T4G Tensor Core GPU」を搭載している。
AWSは、G5gの利用が適しているワークロードを複数挙げ、そのメリットを説明している。「Android」ゲームのストリーミングでは、x86ベースのGPUインスタンスに比べると、1ストリーミングについて1時間あたりのコストが最大30%削減されるという。機械学習(ML)による推論では、CPUパフォーマンスに影響を受けるモデル、あるいはNVIDIAの人工知能(AI)ライブラリーを活用するモデルで力を発揮する。また、グラフィックスのレンダリングなどで、G5gインスタンスはコスト効率が最も高いオプションになるという。
これらのインスタンスは、「NVENC」「NVDEC」「nvJPEG」「OpenGL」「Vulkan」「CUDA」「CuDNN」「CuBLAS」「TensorRT」といった、数多くのグラフィックライブラリーやMLライブラリーに対応する。
G5gインスタンスファミリーは現在、米国東部(バージニア北部)と米国西部(オレゴン)、アジアパシフィック(ソウル、シンガポール、東京)などのリージョンで、オンデマンド、スポット、Savings Plan、リザーブドインスタンス形式で利用可能になっている。
またAWSは、Amazon EC2で、AMDの第3世代プロセッサー「EPYC」を搭載した「M6a」インスタンスファミリーの一般提供を開始したと発表した。このプロセッサーの動作周波数は最大3.6GHzとなっており、M6aは前世代の「M5a」インスタンスファミリーに比べるとコストパフォーマンスが最大35%向上している。このインスタンスファミリーは、ウェブサーバーやアプリケーションサーバー、小規模データストアといった汎用目的のワークロードに適している。
M6aはM5aよりも優れた価格性能を実現しているだけでなく、192基の仮想CPU(vCPU)と768GiBのメモリーを搭載した「48xlarge」インスタンスという、より大規模なタイプを提供する。さらに、M6aは「Elastic Fabric Adapter」(EFA)に対応しているため、HPCや動画処理といった、低ネットワークレイテンシーとノード間通信のスケーラビリティーの高さが求められるようなワークロードに適している。
M6aインスタンスは現在、米国東部(バージニア北部)と米国西部(オレゴン)、欧州(アイルランド)などのリージョンで、オンデマンド、スポット、リザーブドインスタンス、あるいはSavings Planの一部として利用可能になっている。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。