NECは、人工知能(AI)研究用スーパーコンピューターを構築すると発表した。2023年3月に国内企業で最大規模(4月18日時点の同社調べ)の580ペタフロップス(PFLOPS。1PFLOPSで浮動小数点演算を1秒間に1000兆回可能なことを表す)超となるシステムの稼動を予定している。
AIスーパーコンピュータのマシン室完成予想図
開発するスーパーコンピューターは、同社の数百人のAI研究者が利用できるもので、数十億円を投じて設計・構築する。システム構成は、1ノード当たり8基のハイエンドGPU「NVIDIA A100 80GB Tensor コア GPU」を搭載した最新GPUサーバー116台(スーパーマイクロ製)と、16ペタバイト超の「EXAScaler」高性能並列ファイルシステム(データダイレクト・ネットワークス製)を搭載したストレージアプライアンスとなっている。
理論上の処理性能は580PFLOPS超となり、数千万枚の画像を数分間で学習できる。また、ネットワークには高速イーサネットスイッチ「NVIDIA Spectrum SN3700」を採用し、全サーバーを200GbEで接続して、「RDMA over Converged Ethernet(RoCE) v2により超高速・低遅延通信を行う。これにより高速な分散学習が可能になる。
構築においては、Kubernetesを中核としたNEC独自の構築技術を活用することで、先端ハードウェアとソフトウェア群を密に結合させ、高性能かつ利便性の高いシステムを構築する。
既に一部のシステム(100PFLOPS)については、NECの数百人のAI研究者が利用を開始しており、今後構築する480PFLPOSのシステムを加え、国内最高峰のAIに特化した研究開発環境として、より高度な先進AIの迅速な開発に役立てる。来的には、顧客やパートナーとの共創により先進的な社会価値を産み出すAI研究のセンターオブエクセレンスの実現を目指す。