内部設計の改良で大幅な性能向上を実現第2世代とのソケット互換で既存システムの強化にも寄与
AMD EPYC は、2017年の第1世代「Naples」に始まり、2019年の第2世代「Rome」、2021年の第3世代「Milan」と、順調にロードマップ通りのリリースを重ねてきている。しかも、世代が新しくなるたびに着実に性能の向上を実現し続けているのだ。
今回発表したMilanでは、Romeの製造プロセスや基本構成を受け継ぎつつ、内部設計に改良を加えているのが特徴だ。8つのCPUコアを持つCPUチップレット8個とI/Oチップレット1個を結合し、全体で最大64コア128スレッドという構成はそのままに、各チップレットにはさまざまな改良が施されている。
例えば、CPUマイクロアーキテクチャがRomeの「Zen 2」から「Zen 3」へと進化し、より効率的に命令を処理できるようになった。CPUクロック1サイクルあたりに処理できる命令数は、最大で約19%向上しているという。各CPUチップレットに内蔵されているL3キャッシュメモリも、Romeでは4コアごとに16MBが割り当てられていたのに対し、Milanはチップレット全体で統合され、8コアが全32MBのL3キャッシュを共有する形となった。つまり、全体の容量を変えることなく、キャッシュをより柔軟に割り振ることができるようにしたのだ。日本AMD株式会社 コマーシャル営業本部 セールスエンジニアリング担当 マネージャーの関根 正人氏は、以下のように説明する。
日本AMD株式会社
コマーシャル営業本部
セールスエンジニアリング担当 マネージャー
関根 正人氏
「例えば、複数のCPUコアを割り当てるような大型のVM(仮想マシン)では、最大8つのコアがすべて同じL3キャッシュを利用できるようになり、より効果的にキャッシュを活用できます。逆に、1つのコアにL3キャッシュを集中させる場合には、使える容量が最大16MBから32MBへ倍増することとなります。いずれのアプリケーションでも、より大きなキャッシュ効果を得られるデザインとなったのです」
第2世代「Rome」の特徴を生かしつつ、性能を大きく向上させた第3世代「Milan」
メモリへのアクセスも、内部バスとの同期を改善し、レイテンシを低減。メモリのチャネル構成も、Romeでは4チャネルまたは8チャネルのインターリーブをサポートしていたが、Milanでは6チャネルにも対応し、システム設計の幅が広がった。
また、EPYC独自の機能として搭載されているセキュアプロセッサを利用したセキュリティー機能についても、Milanでさらなる強化が加えられている。本機能は、閉じた環境で専用OSを稼働させて暗号鍵を生成・管理し、ハードウェアプラットフォームからセキュリティを担保するというものだが、Milanでは暗号化対応範囲がさらに拡張され、例えばHypervisor からVMのメモリへの書込み禁止機能(SEV-SNP)が追加された。
こうした改良も相まって第3世代のEPYCは、トータルの性能がより一層強化され、競合に対するアドバンテージをさらに広げている。ベンチマークでは、クラウドで多用される整数演算、HPC(ハイパフォーマンスコンピューティング)で多用される浮動小数点演算、エンタープライズ用途に多いJava、いずれも倍以上のスコアを達成。実アプリケーションにおいても、1.5倍から2倍近いパフォーマンスが確認されている。
Milanは数多くの項目で高いパフォーマンス性を発揮
大きな特徴として、MilanはRomeとソケット互換になっている点が挙げられる。BIOSなどの対応次第では既存システムをアップグレードすることも可能になっているという。ラインアップには今回、8/16/24/32/64コア、および28/56コアが用意されており、いずれも機能サポートは共通だ。
少数コアの製品で型番に「F」を含むものは、より高いクロック周波数に対応した高クロック品。チップレットの数を減らすのでなく、CPUチップレット8個のまま各チップレット上のコア数を減らしたものだという。熱や電力の容量に余裕ができてクロック向上が可能になっている。さらに、コア数を減らした分、チップレット内のL3キャッシュやI/Oを潤沢に使えるようになるため、1コアあたりのパフォーマンス向上も期待できる。
「Milanでは、コア数の割に高いシステム性能を得られるようになっています。シングルコア性能が重要なアプリケーションで有利になることはもちろん、コア数に応じて課金されるソフトウェアを使う場合は、ライセンス費用の抑制につながります。また、ソケットあたりのコア数に制限があるシステムの場合も、より高い性能を発揮できます」(関根氏)
8コアでは高クロック品のみの提供となっている
また、型番末尾に「P」がつくものはシングルソケット専用のモデルであり、その分価格も抑えられている。Milanでは、1ソケットあたり128レーンのPCIeをサポートし、2ソケットでは最大162レーンが利用可能となる。そこまでの処理性能や入出力性能が要求されないシステムでは、このシングルソケット専用品を活用することにより、ユーザーの投資抑制が期待できる。
エコシステムも拡大しEPYC搭載サーバの選択肢も多彩に
EPYCは、すでに第2世代のRomeをリリースした時点で競合を大きく上回るパフォーマンスで業界をリードする存在となっており、多くのソフトウェアベンダーやサーバメーカーがそのエコシステムに加わっている。そしてMilanについても、これらのベンダーやメーカーは迅速に対応してきた。EPYC搭載製品を数多くラインアップするサーバメーカーのSupermicroも、Milanの発表に合わせ、その特徴を生かすサーバを多数アナウンスしているだけでなく、Milanで達成されたベンチマーク世界記録更新にも寄与したという。
「SPECjbb2015世界記録を達成したのは、実はMilanを搭載した当社のブレードサーバシステム『SuperBlade®』です」と語るのは、Super Micro Computer, Inc. GM, FAE & Business Developmentの佐野 晶氏だ。
Super Micro Computer, Inc.
GM, FAE & Business Development
佐野 晶氏
「8Uサイズの筐体にシングルソケットのブレードを最大20ノード搭載する、高集約かつコンパクトなシステムです。水冷ソリューションも用意しており、Milanの高パフォーマンスに伴う発熱にも対応しています。これが功を奏し、当時世界記録のパフォーマンス性を誇っていたRomeを最大36%も上回っています」
ベンチマーク世界記録更新にも使われた、Supermicroの「SuperBlade®」
SuperBladeは、ノード間を接続するネットワークスイッチなども内蔵し、配線は外部からの電源やネットワークなど少数で済むため、HPC用途など高集約システムを構築するのにふさわしいサーバプラットフォームと言えよう。ノード数は初めから20ノードを搭載する必要はなく必要最小限で構成ができるため、将来的な拡張性を持たせた導入も可能。またI/O+ストレージを搭載したノードと、GPUを搭載するノードとを混在できるため、全体のバランスを考えて柔軟な構成にすることができる。
Supermicroは、独創的なアイデアを盛り込んだ多彩なサーバラインアップを特徴とするメーカーで、EPYC対応製品も以前から数多く提供してきた。
「AMDのCPUを搭載するのは『A+』シリーズで、最新の『H12』世代にも多彩な製品を取り揃えています。これまでRomeを搭載して販売してきた製品にも、Milan対応の新たなBIOSを提供し、そのラインアップを引き継ぎました」(佐野氏)
Supermicroのマルチノード高集積サーバ製品群。SuperBladeのほかにも多彩な製品をラインアップ
EPYCの特徴を最大限まで生かせるポイントは、高集積型のサーバ製品群にある。1ソケットあたり64コアもの高集積CPUであるEPYCを、さらに高密度に実装することで、高いコンピューティング性能を要求するワークロードをコンパクトに実現できるようになっている。
例えば「BigTwin®」は、2Uサイズに4ノードを搭載、つまり一般的な1Uサーバに相当する性能を1/2Uに実装したもので、デュアルソケット対応のノードも用意されているため最大512コアが2Uサイズに収まる形になっている。そこまでの高集積を求めていない用途には、シングルソケットのノードを使う「TwinPro®」もある。また、4Uサイズに8ノードまたは4ノードをラインアップしている「FatTwin®」シリーズでは、一部モデルに電源以外のすべてを前面からアクセスするデザインを採用しており、データセンター運用の効率化が期待できる。
もう一つの特徴はPCIeの豊富なラインアップにある。シングルソケットで128レーン、デュアルなら162レーンというEPYCの特徴を生かし、そのインタフェースをフルに活用した製品も揃っている。
「近年では、AIやクラウドゲーム、グラフィックを多用する業務などの増加に伴い、GPUのニーズも高まってきており、GPUカードの搭載に最適化したGPUサーバも各種用意しています。例えばPCIeタイプのGPUカード専用機では、2ソケットでPCIeを162レーン利用できるRome/Milanの特徴をフルに生かし、160レーンをGPU用に割り当て可能なモデルも用意しました。EPYCは、これだけ多数のレーンでもPCIeスイッチチップを介さず実現できるので、サーバアーキテクチャはシンプルになり、レイテンシの面でも有利になります」(佐野氏)
EPYCが対応するPCIe Gen4.0は、高速な最新ストレージインタフェースNVMe Gen4としても利用可能で、それに向けた新製品も開発中だ。2UサイズにシングルソケットEPYCを2ノード搭載でき、各ノードはPCIe Gen4.0のGPUカードとNVMe Gen4のSSDを組み合わせた構成になるという。
「この新製品も、近くローンチ予定です。アクティブ冷却のGPUカードにも対応し、各ノードにPCIe Gen4.0のGPUカード3つとNVMe Gen4のSSDを4つ搭載できるため、ゲームのホスティングなどに適しています」(佐野氏)
2ソケットのEPYCで160レーンのPCIeをGPU用に割り当てることが可能。PCIe Gen4.0のGPUカードとNVMe Gen4のストレージを組み合わせて搭載できるサーバも開発中
標準的なフォームファクタである1Uや2Uのサーバでも、SupermicroではEPYCの豊富なインタフェースを生かした製品をラインアップしている。例えば「WIOサーバ」は、1Uサイズで1ソケットのEPYC、NVMe Gen4のSSDを前面に10本搭載、さらに背面にもPCIe Gen4.0カードを搭載できるなど拡張性に優れているモデルだという。
1UサイズのWIOサーバ群
その他にもSupermicroでは、エンタープライズ向けの「Ultra」や、クラウドプラットフォーム向けの「CloudDC」、2Uサイズのメインストリーム製品といった各種ラックマウントサーバ、さらにタワー型の汎用サーバやワークステーションなど、EPYC搭載製品を幅広く用意している。
「当社ではRomeの頃から多種多様な製品をラインアップしており、大規模な複数のデータセンターで当社のA+シリーズが採用されるなど、導入実績も豊富にあります。Milanのリリースを受けて、当社のサーバラインアップはさらに拡大しつつありますし、安定して世代を重ねていることから市場やユーザーの信頼感もさらに高まっているといえるでしょう。当社のWebサイトには、仮想の展示ブース『3Dバーチャルブース』を用意しており、さまざまなモデルの紹介ビデオや、オンラインミーティングによる相談・商談にも応じていますので、ご興味のある方はぜひアクセスしてみてください」(佐野氏)