GraphcoreのIPUの性能についてデル インフラストラクチャ・ソリューションズ事業統括 製品本部 シニア システムエンジニア 谷本剛氏は「深層学習のトレーニング時はTesla V100の2~10倍、推論時は100倍と聞いている」と説明する。ただし、同社はIPUがGPUを置き換える存在だとはしておらず、あくまでも機械学習やHPCといった個別のワークロードに応じて用いるようになると述べていた。
デル インフラストラクチャ・ソリューションズ事業統括 製品本部 シニア システムエンジニア 谷本剛氏
冒頭に挙げたDSS 8440のスペックは最小構成だが、一番の特徴は最大10枚のGPUもしくはIPUを搭載可能。提供を開始するDSS 8440では4/8/10枚構成を用意し、2019年後半リリース予定のGraphcore IPUは8枚構成となる。最大10基のNVMe、SAS/SATAドライブを搭載可能、最大8つのPCIe×16スロットを用意する。
4Uサーバーながらも空冷を採用し、「TDP 205W CPU構成でも摂氏35度の環境で最大10GPUが稼働できる。NVLINKを採用しなかったが、社内でベンチマークを行ったところ、パフォーマンスあたりの消費電力が優れているので、PCIeスロット数を優先した」(谷本氏)
カードやストレージは背面から設置。電源は2400W×4、1+1の冗長性を確保(出典:デル)
DSS 8440のハードウェアトポロジー(出典:デル)
デルのサーバー製品といえば「PowerEdge」ブランドが有名だが、動作yはPowerEdgeブランドを「汎用用途」、DSSシリーズを「特殊(専用)用途」と位置付ける。
前述の通り、DSSシリーズは以前から販売していたが、上原氏は「個別に顧客と対話が必要な大規模案件や、PowerEdgeで補えないケースで提供していた。従来は大規模導入を前提としていたが、DSS 8440に関しては1台から受け付ける」と説明。「機械学習専用のモンスターマシンであるDSS 8440をラインアップに加え、PowerEdgeとDSSシリーズの“二刀流サーバー製品戦略”で顧客のきめ細やかなニーズに対応する」(上原氏)と市場に対する姿勢を明確にした。
アクセラレーテッドコンピューティングでの半導体の役割(出典:デル)