Power11エントリー マシン:Power S1124およびPower L1124
トランザクション処理のためにデータベース マシンを稼働しているのであれ、分散型Webアプリケーションおよびそれらに関連するバックエンドのためにスケールアウト型マシン クラスターを稼働しているのであれ、この数十年間、ほとんどのデータセンターにおける主力マシンは2ソケット サーバーでした。そして、多くのOS/400およびIBM i のショップにとっては、2ソケット マシンは、演算性能とストレージ拡張および密度との適度なバランスをもたらすマシンでした。
しかし、長い年月の間に、Powerプロセッサーのコアがより強力になるのにつれて、それほどパワーを必要とせず(比較的に)、それほど変化も多くない(ビジネスとともに規模は大きくなるものの、ビジネスほど急速に大きくなるわけではない)トランザクション処理アプリケーションを稼働するために顧客が必要とするコアの数は、ますます少なくなっています。そのため、多くのIBM i 顧客のPower8、Power9、またはPower10システムのコア数は1~4個です。
大型の4 wayおよびより大型のシステムを必要としてきた顧客も同様に、以前のシステムをベースにして考えたものよりも、コア数が少なく、物理的により小さいマシンへシフトダウンすることができています。そして、これらのマシンで外部SANストレージを採用することにより、4Uラック エンクロージャーに収まる2ソケット サーバーに、かなり強力なマシンを詰め込むことができます。
Power11システムのラインアップの分析を行うにあたり、最初にPower S1124サーバーを選んだのは、そのような理由からです。昔の主力マシンのように見えますが、ビッグ アイアン マシンのような性能が、そうした比較的小さいフォーム ファクターにすべて詰め込まれているのです。
Power S1124システムには2つのソケットがあり、それぞれのソケットには一対のPower11プロセッサーが搭載されていて、それらはPower11プロセッサー上に組み込まれたNUMAリンクを使用して相互に接続されています。これは多くの前世代のPowerアイアンと同様です(PowerサーバーでSMPまたはNUMAクラスタリング用の外部チップセットが最後に使用されたのがいつだったのか思い出せません)。Power11チップは、Power10チップと同様に、コア当たり8スレッドの16個のコアを搭載していますが、Power 11では、チップは多少より高速に動作し、歩留りが多少向上しています。これは、IBMのPowerおよびzチップのチップ ファウンドリー パートナー(言うまでもなくSamsung社)の改良された7ナノメートル プロセスへの移行によるものです。
Power S1124マシンでは、それぞれのPower11チップは、16コアのうち、8、12、または15コアがアクティベートされており、16番目のコアはホット スペアとされています。コアに障害が発生した場合、このスペア コアは自動的にアクティベートされ、PowerVMハイパーバイザーが進行中の処理を再開します。顧客は、この予備のコアに対する料金も、予備のコア用のIBM i ライセンスに対する料金も支払う必要はありません。
顧客は1つの16コアのプロセッサー モジュールを購入することができ、もうひとつ16コアのプロセッサー モジュールを追加して合計32コアにすることができます(つまり2つの異なるベース構成)。これはフィーチャー コード「#EP3X」で、コアは3.4 GHzのベース スピードで動作しますが、コンピュート コンプレックスの電力消費に応じて動的にクロック スピードが変化するため、最大では4.2 GHzで動作することになります。他の2つは、2つのプロセッサー モジュールの構成で、それぞれPower11 DCMが組み込まれています。モジュール当たり24コアの構成では、Power11チップをベース3.05 GHz~最大4.15 GHzで稼働します。一方、モジュール当たり30コアの構成では、Power11チップをベース2.8 GHz~最大3.95 GHzで稼働します。もちろん、コア数が多くなると、コア当たりのパフォーマンスは低下しますが、システムのスループットは急速に向上します。2.8 GHzで動作する60コアのマシンも、なかなかのパフォーマンスです。Power11で提供される、コア当たり8スレッドのマシンは特にそう言えます。これはSMT8と呼ばれ、このモードはPower8、Power9、およびPower10で提供されていました。Power9は、SMT4モードをハードウェアで提供し、これは、コア数を倍増し、プロセッサーにおけるNUMAドメインを拡大する効果がありました。
以下に、「Godel」 Power11 DCMのブロック図を示します。
上の図は、IBMのRedbookから引用したものですが、すでにRedbookに掲載された時点で、図の切り取りが上手く行われていなかったようです。非常に読みづらいので、Power S1024サーバーで使用される一対のDCMのブロック図を以下に示すこととします。DDR5メモリーのスピードが異なる点、プロセッサーのアクティブなコアの数およびスピードおよび熱性能などが明らかに異なる点を除けば、まったく同じだと思われます。
以下が、見やすいブロック図です。
Power S1124では、差動DIMMメモリーは、4.8 GHzまたは4 GHz(メモリー容量によって異なる)で動作するDDR5メモリーがベースになっています。64 GBおよび128 GBのメモリー モジュール(それぞれ32 GBおよび64 GBの容量の2つのD-DIMMから成る)は、より高速な4.8 GHzのスピードで動作します。一方、より容量の多い256 GBおよび512 GBのメモリー モジュール(半分の容量の一対のD-DIMMから成る)は、より低速な4 GHzのスピードで動作します。Power S1124の2つのモジュールにわたって、4.8 GHzのメモリーは、32のメモリー スロット全体で2,546 GB/秒の帯域幅を提供し、4 GHzのメモリーは、2,048 GB/秒の帯域幅を提供します。これはかなりの帯域幅です。そして、DDR5メモリーはX86サーバー チップで一般に使用されている6.4 GHzメモリーに比べると、はるかに低速で動作するため、かなり少ない数のメモリー スロットおよびコントローラーでも帯域幅を向上させることができ、その分、エラー率が低くなります。
Power S1124でより高い帯域幅を求める場合、容量の多いメモリーは使用することができないため、マシン当たり4 TBで最大容量となりますが、OMIフロント エンドで容量の多い256 MB DDR5モジュールを使用した場合と比べて、システム メモリーを最大容量の半分または1/4に減らすことと引き換えに、25%増しの帯域幅(2 TB/秒に対して2.5 TB/秒)が得られます。
参考までに、IBMのPower S924、Power S1024、およびPower S1124エントリー サーバーのそれぞれの特徴についてまとめた表を以下に示します。
| Power S924 & H924 | Power S1024 & L1024 | Power S1124 & L1124 | |
|---|---|---|---|
| IBM i ソフトウェア ティア | P20 | P20 (12 core), else P30 | P20 (16 core), else P30 |
| プロセッサー | Power9 | Power10 | Powerll |
| プロセッサー モジュールのコア数 | 8,10,11, 12 | 12,16,24 | 16,24,30 |
| プロセッサー モジュール タイプ | SCM | DCM | DCM |
| プロセッサー ソケット数 | 1 or 2 | 1 or 2 | 1 or 2 |
| 最大コア数 | 24 | 48 | 60 |
| プロセッサー消費電力 | 175 W | 415 W | 500 W |
| プロセッサー相互接続 | 2 x 4B @ 16 Gb/sec | 4x 2B @ 32 Gb/sec | 4x 2B @ 32 Gb/sec |
| システム当たりのメモリー チャンネル数 | 16x DDR4 RDIMM | 32 x OMI DDR4/DDR5 | 32 x OMI DDR5 |
| システム当たりのメモリー帯域幅(ピーク時) | 340 GB/sec | 1,636 GB/sec | 2,546 GB/sec |
| システム当たりの最大DIMM数 | 32 x DDR4 DIMMs | 32 x D-DIMMs | 32 x D-DIMMs |
| システム当たりの最大メモリー容量 | 4TB | 8TB | 8TB |
| アクセラレーション ポート | 4 ports @ 25 Gb/sec (OpenCAPI) | 6 ports @ 25 Gb/sec (OpenCAPI) | - |
| システム当たりの最大PCI-Expressレーン数 | 84 x PCI-Express 4.0 @ 16 Gb/sec | 128 x PCI-Express 4.0 @16 Gb/sec | 128 x PCI-Express 4.0 @ 16 Gb/sec |
| システム当たりの最大PCI-Expressスロット数 | 5 x PCI-Express 4.0 x16 slots 6x PCI-Express 4.0 x8 slots |
4 x PCI-Express 4.0 x16 or 5.0 x8 slots 4 x PCI-Express 5.0 x8 slots 2 x PCI-Express 4.0 x8 slots |
4x PCI-Express 4.0 x16 or 5.0 x8 slots 4x PCI-Express 5.0 x8 slots 2 x PCI-Express 4.0 x8 slots |
| 内部ストレージ コントローラー用スロット | Dedicated | General Purpose | General Purpose |
| 内部ストレージ | 18 x SAS Disk/Flash SSD or 4 x NVM-Express U.2 |
16x NVM-Express U.2 | 16x NVM-Express U.2 |
| 最大I/O拡張ドロワー数 | 1.5 | 2 | 2 |
| サービス プロセッサー | FSP | Enterprise BMC | Enterprise BMC |
| RAS | - | Active Memory Mirroring | Active Memory Mirroring |
| セキュリティ | - | Main Memory Encryption | Main Memory Encryption |
| メモリー圧縮 | - | Active Memory Expansion | Active Memory Expansion |
Power S1124には、OpenCAPIアクセラレーター ポートはないようですが、すべてのPower11コアに搭載されている(すべてのPower10コアにも搭載)オンチップのMatrix Math Accelerator(MMA)を使用した場合よりもAI処理パフォーマンスを向上させるために、IBMがそのうちPower11システムに接続する「Spyre」アクセラレーターを提供することを考えると、これは意外に思えます。
発表レター「AD25-0036」(Power S1124の詳細について参照できます)で、IBMは、Power S1124システムのCapacity BackUpバリアントを提供すると述べています。また、このボックスのPower Solution Edition for Healthcare(ヘルスケア向けPowerソリューション エディション)ついても、開発する意向を表明しています。
Power S1124およびLinux専用のPower L1124バリアントは、7月25日に利用可能となります。Power11マシンのハードウェア価格設定について、また、Power11マシンとPower10マシンとの相違点、および各Power11マシン間での相違点については、現在、鋭意調査中です。今後の記事をお待ちください。IBMは、以前にLクラス マシンで行ったように、Linux採用を促進するためにPower L1124の割引を行うと推測されます。
