RPGコード アシストは、AIで強化されたPower Systems向けのキラー アプリケーションになる
「計画どおりって最高」 - 「ハンニバル」ことジョン・スミス大佐、テレビドラマ 『特攻野郎Aチーム』
ここ、『 The Four Hundred』では、私たちが知り得た限りの情報を紹介するよう努めています。そして、今まさにIBMには、IBM i ソフトウェア プラットフォームとも関連のある、生成AIおよびPower Systemsハードウェア プラットフォームに関して、計画どおりの方向に進みつつあるものがあるようです。
月曜日の記事で、IBMはPower Systemsラインに関して何か企んでいることがありそうだと述べましたが、火曜日にラスベガスで開催されたTechXchange 2024イベントで、パートナー企業と、重要だと思われる顧客に、それが明らかにされました。IBMは、IBM Researchによって開発され、製品化されようとしている、「Spyre」 AIアクセラレーターをPower Systemsラインに追加しようとしているようです。そして、フリーフォームRPGをきちんと理解して流暢に話す大規模言語モデルである、RPG向けコード アシストの商用バリアントは、少なくともIBM i のショップにとっては、キラー アプリケーションになるように思われます。
TechXchangeで何が発表されるか予想した月曜日の記事で、Watsonxモデルを使用して、GPU処理を必要とすることなく、企業データに対してRAG(Retrieval Augmented Generation: 検索拡張生成)の処理を行うために、Power10チップのオンチップ行列演算およびベクトル アクセラレーターをどのように使用することができるかを見ることは興味深いだろうと述べました。パワーは十分にあるため、本番アプリケーションに有用かもしれません。
また、IBMはハイブリッドCPU-GPUマシンを開発して、PowerアイアンのAI処理能力を強化することもできるとも述べました。さらには、メモリー コヒーレント ファブリックを通じてリンクされたアウトボード サーバーで推論アクセラレーターを使用することもできます。そして、AI Enterpriseスタックを稼働するGPUアクセラレーターによってNvidia社が手にした覇権に対抗して、Power10プロセッサー、AMD Instinct MI300Xアクセラレーター、AMD社のROCmライブラリーおよびドライバー スタック、Python言語、Meta Platforms社のPyTorchフレームワークおよびLlama 3.2モデルを組み合わせたら、さらに興味深いだろうと付け加えました。
これは、なかなか好い線を行っていると思われ、後者については、いつかはそうなることもあるかもしれません。しかし、記事を書いていたのが金曜日の夜遅くだったこともあり、IBM自家製の「Spyre」AIアクセラレーション ユニットのことは、頭からすっぽり抜け落ちていたようです。Spyreについては、8月に「Telum II」 z17メインフレーム プロセッサーと一緒に公開されたときに、 『 The Next Platform 』誌で改めて取り上げました 。 初期のAIUについては2022年10月に記事で取り上げ、このデバイスは科学研究プロジェクトにとどめておくべきではなく、科学関連製品として商用化すべきと提言しています。その後、これがPower Systemsにとって、うってつけのAIアクセラレーターだということはすっかり忘れてしまっていました。
このAIUには、Power10チップに組み込まれているものとは異なる種類の行列演算ユニットが組み込まれていますが、それは「Telum」 z16メインフレーム プロセッサーの行列演算ユニットから派生したものです(もっとも、それ自体が数年前にIBM Researchによって開発されたオリジナルのAIUから派生したものですが)。Spyreカードは、すでにSystem zメインフレーム向けアクセラレーターとされていました。ところが先日、IBMは、 発表レター「AD24-2186」で、次のような2つの文から成る「開発意向表明」を発表しました。
「IBMは、将来のPower製品にIBM Spyreアクセラレーターを搭載し、AIコンピュート機能を追加する予定です。IBM PowerプロセッサーとIBM Spyreアクセラレーターが連携することで、企業にとって要求の厳しいAIワークロードを拡張する次世代インフラストラクチャーが実現します。」
とすると、年末までに、今後のPower Systemsについて別の発表がありそうです。
Spyreチップには34個のコアがあり、そのうち、実際に使用されるのは32個で、残り2個は、どのチップ メーカーも抱えている通常の歩留り問題のために、無効とされています。以下の画像をご覧ください。
正確に言うと、Spyreアクセラレーター チップは、Samsung社の5LPE低消費電力5ナノメートル プロセスを使用し、330平方mmの面積に260億個のトランジスタを詰め込んでいます。
以下は、コアレット(corelet)と呼ばれる、Spyreチップの機能ユニットを表すブロック図です。
Spyreコアレットには78のスレッドがあるように見受けられます。加えて、8つのFP16アキュムレーションおよびアクティベーション ユニットと、さらに8つのFP16/FP32アキュムレーションおよびアクティベーション ユニットがあるようです。それぞれのコアレットに、2 MBのスクラッチパッド メモリーがあります。Spyreチップ上でコアを互いに接続している32バイト双方向リングと、2 MBのスクラッチパッドを互いに接続している128バイト双方向リングがあり、それら32個の使用可能なSpyreチップに対して合計64 MBの使用可能なメモリーとなります。
IBMは、2か月前のHot Chips 2024で、このデバイスは、Spyreチップとの間の入出力で200 GB/秒の帯域幅を実現する低消費電力のLPDDR5メモリーを使用すると述べています。HBMメモリー スタックの数およびそれらの世代によっては、GPUの帯域幅が3.4 TB/秒~8 TB/秒にもなる今日では、200 GB/秒というのは大した数字ではありません。しかし、それでも、Spyreチップを活かすのには十分です。
以下は、Spyre PCI-Expressアクセラレーター カードの画像です。
ご覧の通り、Spyreカードには、LPDDR5メモリーのバンクが8つあり、容量は128 GBとなります。これは、最近のNvidia社またはAMD社のGPUアクセラレーターのメモリー容量にも引けを取りませんが、このメモリーがかなり低速であることは明らかです。Spyreカードは、300 TeraOPS以上のAIパフォーマンス(FP16の解像度と推定)を実現し、シングル幅PCI-Express 5.0 x16スロットに装着します。消費電力は75ワットのみで、これはGPUの1/10以下です。
ここからが、比較検討が面白くなるところです。拡張ドロワーに8枚のSpyreカードが接続されている場合、それらのカードは、AIモデル向けに1 TBのメモリーおよび1.6 TB/秒の集約メモリー帯域幅を実現します。AIモデルがあまり高密度でないとすれば(ほとんどの企業では、少なくともしばらくの間は、そうはならないと思われますが)、これら8枚のカードが接続されたPower Systemsの拡張ドロワーは、IBM i のショップにおける多くの生成AIユース ケースにうってつけのAIサイドカーとなるでしょう。
このことから、今週、IBMが公開した 発表レター「AD24-2179」の次の「開発意向表明」へとつながります。
「IBMは、RPG用コード アシスタントを提供することを予定しています。これは、IBM i ソフトウェアの開発者が既存のRPGコードを理解し、自然言語記述を使用して新しいRPG関数を作成し、RPGコードのテスト ケースを自動的に生成するのを支援する生成AIツールです。」
そして、コードをモダナイズする必要があるIBM i のショップには、Spyreカードを何枚かまとめて購入したいと考える理由があります。そのため、モダナイズが必要なコードの量や、RPG開発者の減少を考慮して、カードをまとめて購入してもあまり高額にならず、このAIベースのRPGコード アシストの料金もそこそこに抑えられるようにIBMが配慮してくれるのであれば、これはPower Systemsビジネス向けのキラー アプリケーションとなるかもしれません。
詳しい情報もそうですが、実際に製品化されるのが待ち遠しいものです。もっとも、噂が本当なら、数週間のうちには、さらなる情報が届けられると思われます。