富士通は11月9日、CPUとGPUの計算処理をリアルタイムに切り替える技術「アダプティブGPUアロケーター技術」を開発したと発表した。生成AIや深層学習などの需要の高まりを受け、世界的なGPU不足への対応が求められている。
同技術は、複数のプログラム処理を実行中の場合において、GPUを必要とするプログラムやCPUで処理してもよいプログラムを高速化率を予測するなどして区別し、優先度の高いプログラム処理に対してリアルタイムにGPUを割り振ることができる。
これにより、利用者は先行しているGPUでのプログラム処理を終えるまで待つ必要がなくなるほか、CPUで処理が始まっているプログラムに対してもGPUの利用状況を踏まえてリアルタイムにGPUへ切り替えることが可能になり、GPU利用の効率化を実現する。GPUを利用するAIや高度な画像認識などのアプリケーション開発で、グラフAIデータを処理するモデルの学習などを素早く実施可能になるとしている。
CPUとGPUの割り当て切り替えのイメージ
また、複数台のコンピューターを協調動作させる高性能コンピューティング(HPC)システムにおいて、現在実行中のプログラムの完了を待たずに利用可能とする、複数のプログラムのリアルタイムな実行切り替えを行う「インタラクティブHPC技術」も開発した。
従来の制御方式は各サーバーにプログラム実行を切り替える通信を一つ一つ行うユニキャスト通信を利用していた。この方式では切り替えタイミングのばらつきが発生し、リアルタイムでのプログラム実行の一括切り替えが困難だった。
インタラクティブHPC技術では、プログラム実行を切り替える通信に一斉送信可能なブロードキャスト通信を採用し、リアルタイムでのプログラム実行の一括切り替えを実現した。適切な通信方式はアプリケーションの要件やネットワーク品質によって変わるが、状況に応じて最適な通信方式を選択できるようにしている。
これにより、デジタルツインや生成AI、材料・創薬探索などの分野におけるリアルタイム性が求められるアプリケーションを、HPC並みの計算リソースを用いてより高速に実行することが可能になる。
プログラムの実行切り替えに用いる通信方式の違い
なお、富士通ではいずれも世界初の技術であるとしている。
今後、アダプティブGPUアロケーター技術については、「Fujitsu Kozuchi (code name) - Fujitsu AI Platform」でGPUが必要な処理に活用していく予定。インタラクティブHPC技術は、40量子ビットの量子コンピュータシミュレーターで多数のノードを用いた協調計算を行う部分へ適用予定。「Fujitsu Computing as a Service HPC」や「Composable Disaggregated Infrastructure」(CDI)などへの適用も検討してくとしている。