PowerチップでHighとLowを狙う
ニューオリンズで開かれたSuper Computing 2014コンファレンスに先駆けて、昨年11月中旬、米国エネルギー省が巨大並列コンピュータSierraとSummitの構築にIBMとハードウエアのパートナーNvidia社を指定したことをIBMは発表しました。
エネルギー省によるこの指定は、System x サーバー事業をLenovoに売却し、チップの製造事業をGlobalFoundriesに売却したIBMに、今後はPower Systemsラインに焦点を絞らせるとともに、チップの開発とシステム設計に重点的に取組ませる駆動力となります。重要なのは後者です。
私はテクノロジーの採択についてはトリクルダウン理論の熱い信奉者です。しかしながら、すべてのテクノロジーが高所からスーパーコンピュータと世界の巨大データセンターに降りてくるわけではありません。事実、IBMによる高度なテクノロジーの開発とそれを商業上の利益につなげることにおいては今日までその結果に成否の斑が有りました。今回のIBMによるNvidiaとの最新の取組は異なるアプローチ、スケールアウトを採用しています。これは基本的にハイブリッドCPU-GPUシステムで、すでに商業的に広く並列スーパーコンピュータで使われています。
一部のテクノロジーは上から下に巧く機能します。フラッシュは当初企業のデータベースの速度を上げる手段としてスタートしたのですが、続いてハイパースケールの設定では通常となり、いまはスーパーコンピュータに採用されています。小企業は当初NetWare、Unixを稼働させるX86ベースのサーバーを採用し、その後WindowsとLinuxをピザボックスに適合させ、大規模データセンターで通常使うようになりました。
高速の相互接続はすべて頂上でスタートしましたが、AS/400のショップは記憶しているとおり、このプロプラエタリーのシステムは多くの異なる種類のテクノロジーを取り込んだ最初のシステムであり、それには3.5インチのディスクドライブが含まれており、風変りながら進化して密度の高いメモリーチップでした。
CORAL社とエネルギー省とのSierra及びSummitに関る契約額は3億2千5百万ドルで、あらゆる標準に照らして極めて高額です。これはIBMが1990年2月にPowerのアーキテクチャーを世に出して以来頼ってきた必要性の高い慣習を変えて、IBMが商業化を考えている先進システムの早期開発に政府と学究的なスーパーコンピューティングセンターが資金を供給します。
1993年からRS/6000 PowerParallelマシーンがまさにこのケースで、翌年Cornell UniversityとCERNに道を付け、1996年にはエネルギー省が核兵器の爆発をシミュレートするために3テラフロップスのRS/6000 SP 並列システムに列を作りました。1997年、RS/6000 SPのチェス競技用異型Deep Blueが対戦してGary Kasparovを打ち負かしました。スーパーコンピュータ・センターはRS/6000 SPシステムの各リリースを継続して採用し、このときIBMは並列DB2とOracleデータベースをこのシステムに向けて販売していました。スーパーコンピュータの研究開発が直接商業システムには適用されたのはこれが初めてでした。その後IBMは2002年にPower5プロセッサー及びiSeriesとpSeriesの統合システムに並列DB2とOracleデータベースを装備してセールスを開始しています。Lawrence Livemore National Laboratoryの ASCI PurpleスーパーコンピュータはPower5プロセッサーをベースにしており、同じコンピュータが商業システムに使われていましたが、BlueGeneラインのマシーンは数十万から数百万のコアを使うアプリケーションに向けた自社製の相互接続による低電力のチップを使い続けていました。
IBMがBlueGeneをLinuxベースのクラウドに置かなかったことが私にはまったく理解できません。IBMは、Facebook、Google、Yahooといった巨大スケールのデータセンター・オペレーターの料金と競争できる低いコストで製造できなかったのが理由だと私は考えざるを得ません。また、オリジナルのBlue Waters マシーンは馬鹿げたといえるほど大量のPower7コア、メインメモリー、I/O帯域幅を極めて狭いスペースに詰め込んで、その卓越した技術力は他者を寄せ付けませんでしたが約15億ドルで、IBMはこれを製造する資金的な余裕がありませんでした。そこで、IBMはその取組をイリノイ州立大学のNational Center for Supercomputer Applications (NCSA)に一旦投げて、そのマシーンを巨大アナリティクス・ボックスとして自社に戻そうとしました。米国政府がBlue Waters開発のコストを負担し、そのBlue WatersプロジェクトはいまなおIBM iのショップが恩恵を受けているPower7 プロセッサーの開発を支援して、コストを負担しました。
LLNLにおけるCORALプロジェクトとSierraマシーン、及びOak Ridge National LaboratoryにおけるSummitマシーンを、エネルギー省は少なくとも150ペタフロップスのナンバークランチング性能で購入することを約束しており、Oak RidgeにおけるSummitマシーンは多分300ペタフロップスに拡張されます。
SC14コンファレンスにおけるOak RidgeのディレクターJeff Nicholsのプレゼンテーションによれば、Summitマシーンは約3,400サーバー・ノードで、各々がマルチPower9プロセッサーとマルチ「Volta」世代のNvidia GPUコプロセッサーを有しています。このPower9チップはDDR4メモリーをサポートし、Nvidia GPUはHigh-Bandwidth Memory (HBM) 3Dスタックド・メモリーをサポートします。
このメモリーはHynix社とAdvanced Micro Devices社によって開発されたものです。
GPU上のHBMとCPU上のDDRメインメモリーの結合によって1ノードについて最大512 GBになり、大切なことは、ノードの中の全てのGPUとCPUがこのメモリーの全てに単一体としてアドレスできることです。各ノードは800 GBの非揮発性を有し、ノードと外部ストレージ間のバースト・バッファ、あるいはCPUからメインメモリーへの拡張として構成することができます。このことはIBMのCoherent Accelerator Processor Interface (CAPI)を通してPower9 プロセッサーにリンクするであろうことを示唆しています。CAPIは仮想メモリー・プロトコルで、Powerプロセッサー上のPCIコントローラー上に乗っており、周辺機器とプロセッサー間のメモリーの統合を可能にします。
Volta GPUは互いにリンクするとともに、Nvidia NVLinkの2点間相互接続を通してPower9プロセッサーにリンクします。SummitとSierraシステムの中のノードは間もなく市場に出る100 GB/秒のEDR InfiniBandを使って互いにリンクします。
エネルギー省によって構築されているCORALシステムに関する重要なことは、Power9チップをサポートする資金提供が有ることです。これは予測できなかったことです。IBMは昨年10月にチップ製造事業をGlobalFoundriesに売却したとき、すでに14ナノメートル・プロセスに取り組んでおり、私の推測では、このプロセスの縮小はPower8+チップを狙ったものであり、IBMは14ナノメートルのノードはIBMとGloFoプロセスのミックスとなることを明らかにしていました。 IBMは自身のテクノロジーでなくGlobalFoundriesによって10ナノメートル・プロセスに移行することを期待しており、再び私の推測ではこれはPower9チップに向けられます。IBMはプロセスのノードについて口にしていませんが、もしPower9が2017年末に出るのであれば、7ナノメートルのノードが予測され、もしその通りになれば、2019年あるいは2020年までにPower9+が市場に出ることが予測されます。この時点では、NvidiaがVoltaの後にどのGPUアクセラレーターを載せるかにかかわらず、Summitは300ペタフロップスのマシーンにアップグレードされるでしょう。
ロードマップにPower9及びPower9+が載ることがPower Systemsの全ての顧客を安心させ、喜ばせることが分っていれば、IBMはなぜいま5年間のロードマップを公開、提示しないのか不可解です。ロードマップに含まれるべき事項は、System xマシーンをもはや販売しないこと、System xの自身の製造工場はもはや稼働させないこと、そしてX86サーバーに取って代わるシステムとしてPower Systemsの進展に多くが賭けられていること、さらに将来有望なARMサーバーが今年早々に市場に出ることなどです。そしてPowerチップはどこに向かって進むのかそのコースを練り、いま顧客に伝えるときです。さらにIBMは開発者を助けたハイブリッドのコンピューティングだけを大切にして押し進めるのではなく、Nvidia、Mellanox Technologies、その他の支援を得てハイエンドのスーパーコンピュータ分野に伸び、また中小企業分野のローエンドも網羅することを明確に伝えるべきです。CPU及びGPUと数多いレイヤーのメインメモリーとフラッシュメモリーをミックスした単一レベルのストレージマシーンによって、また、それらをスケラビリティーに向けたクラスターを可能にする高速の相互接続によってどのような種類の高度に進化したリアルタイムのコンピューティングが出来るのか想像してください。
望むらくは、IBMはIBM iの将来の場所を見出して欲しい。今、我々の全ては将来のPower9システムのこれらGPUコプロセッサー上で稼働する高度なアナリティクスを真剣に考え出す必要があります。今がそのアプリケーションの計画を立てるときです。今がIBM iを徹底的に拡張、向上させるときであり、またSystem/38とAS/400のときから組み込まれてきたリレーショナル・データベースのようにこのプラットフォームにアナリティクスとその他のシミュレーションとモデリングを組み込むことです。
IBM iの顧客たちがそのような高度なパワーを必要としていないことに対して不平を託っているよりもむしろ、我々はミッドレンジのショップが必要とし、またこの高度なパワーを必要とするワークロードを創ることに重点的に取組むべきです。我々はこの高度な贈り物が与えてくれるメリットを欲するものであり、それを下から単に見つめているだけではありません。