IBM、管理されたアナリティクス、AI向けの新プラットフォーム「watsonx」を発表
先週、開催された年次カンファレンス「Think」で、IBMは、安全でガバナンスを備えた環境で、ビッグ データのクランチングや、AIおよび機械学習アプリケーションの開発を行うための新たなプラットフォーム、「watsonx」を発表しました。
業界アナリストの話を聞くまでもなく、今年は、AI(人工知能)に大いに注目が集まる年になりそうです。 昨年末にChatGPTが一般公開された おかげで、AIの専門家や業界アナリストのみならず、一般の人々も、真に迫った形で人間の真似をすることができる大規模言語モデル(LLM)の膨大な可能性に気付くようになりました。
ChatGPTのようなLLMは、典型的な意味での「インテリジェント」ではありませんが、たとえば、シェークスピア風のソネットを書いたり、高校の学期末レポートを書いたり、さらには構文的に正しいRPGコードを生成したりするなど、かなり驚くようなことを行うことができます。
今や企業は、LLMや、その兄弟分とも言うべき画像生成AI( OpenAIのDALL-E 2や Stable Diffusionなど)をうまく活用しようと、それらに殺到している状況です。IBMも、このような目まぐるしく変化する世界に足掛かりを築こうと模索している企業の1つに他なりません。
IBMがAIへ進出するのは、watsonxが初めてというわけではありません。さらに言えば、IBMがその名前を使用するのも、初めてではありません( IBM Watson Analyticsを憶えている方はいらっしゃるでしょうか)。しかし、この新たなwatsonxオファリングは、AI(ChatGPTのような生成AIなど)に寄せられる新たな関心を盛り上げようとするIBMの試みを表すものです。
watsonxは、watsonx.aiと呼ばれる開発スタジオ、watsonx.dataと呼ばれるデータ レイクハウス、およびwatsonx.governanceと呼ばれる(ご推察の通り)ガバナンス ツールキットの、3つのコンポーネントから構成されています。最初の2つのwatsonxコンポーネントは7月に利用可能となる予定であり、残りの1つは10月に利用可能となる予定です。
watsonx.aiは、開発者が、従来の機械学習モデル(ロジスティック回帰やK-Meansクラスタリングを思い浮かべてください)や、新たな生成AI機能をトレーニング、検証、調整、デプロイする場を提供します。このスタジオは、「堅牢なフィルタリングおよびクレンジング プロセス、監査可能なデータ リネージュに裏付けられた、大規模な企業データのキュレーション セット」をすでに学習済みである「基盤モデル」のコレクションを提供するとIBMは述べています。
ユーザーは、LLMにアクセスできるだけでなく、ソース コード、時系列データ、表形式データ、地理空間データ、およびITイベント データでのトレーニングに適切なモデルにもアクセスできるとIBMは述べます。
watsonx.aiスタジオでは、3つのモデルのグループが提供されます。fm.codeモデルには、コードを書くときに「コパイロット(副操縦士)」アシスタント機能を必要とする開発者にとって有用なコード生成モデルが含まれます。fm.NLPコレクションには、ユーザーが調整できる特定のドメインのためのLLMが含まれます。最後に、fm.geospatialモデルは、気候データでトレーニングされ、自然災害に備える支援をします。
また、IBMは、チャット ボットや対話型AIアプリケーションの構築に適した生成モデルを作成している Hugging Face社によって開発された、何千ものオープンソース モデルを提供する予定です。また、基盤モデルとしてWatson Code Assistant、Watson Assistant、Watson Orchestrate、およびAIOps Insightsをwastonx.aiに組み込むことも予定しているとIBMは述べています。
watsonx.dataはレイクハウスとして機能します。レイクハウスは、Db2、 Oracle、 Teradata のような信頼性の高いリレーショナル データベース テクノロジーに基づいて構築された、管理されたデータ ウェアハウスの要素と、HDFSまたはオブジェクト ストレージ システム(Amazon S3やCleversafeなど)をベースにした、拡張性はあるものの扱いづらいデータ レイクを融合する比較的新しいデータ アーキテクチャーです(Cleversafeは、IBMが数年前に買収し、今日のIBM Cloudストレージの基盤となっているS3互換のオブジェクト ストレージ システムです)。
watsonx.dataは、オンプレミスおよびクラウドの両方で利用可能になり、ユーザーは、そこに保管されているデータを、自分で選んだ分析エンジンに処理させることができるようになります。たとえば、IBMの広く知られたDb2およびNetezzaエンジンをはじめ、 Presto や Apache Sparkのような広く使用されているオープンソースのオプションもあります。先日、IBMは、
watsonx.dataレイクハウスでは、Apache Hadoopデータ レイクの時代から用いられている、Parquet、Avro、およびORCなど、多数のファイル フォーマットがサポートされます。IBMの側での大きな展開と言えそうなのは、 Apache Icebergもサポートするようになることです。Apache Icebergは、データの信頼性を確保するために必要とされたものの、以前のHadoop時代のフォーマットになかった一貫性とトランザクション性を付加した、比較的新しいテーブル フォーマットです。
最後は、信頼できるAIワークフローをユーザーが構築するのを支援するように設計されたAIガバナンス ツールキットである、watsonx.governanceです。このツールキットは、顧客が、AIモデルの構築に関連するリスクを軽減しながら、ガバナンスを運用するのを支援するとIBMは述べています。このガバナンス ツールキットは、透明性があり説明可能な成果をもたらしながら、「顧客のプライバシーを保護し、モデルのバイアスやドリフト(精度の低下)を能動的に検出し、組織が倫理基準を持たす」ための仕組みを提供します。
「基盤モデルの開発により、ビジネスのためのAIは、これまで以上に強力になります」と、IBM会長兼CEOのArvind Krishna氏はプレス リリースで述べています。「私たちは、お客様が単に利用するだけではなく、AIを活用できるようになるために、企業のニーズに合わせてIBM watsonxを提供します。IBM watsonxを利用することで、お客様はデータを管理しながら、ビジネス全体にわたって自社向けのAI機能を迅速に学習・展開することができます。」
現時点ではIBM i特有の接続性の要件があるようには思われません。しかし、開発者およびデータ エンジニアを絶えず悩ましている従来のデータ統合およびETLの頭痛の種を除いては、Db2 for iから、この新たなIBMレイクハウスへデータを移動する上でハードルはほぼなさそうです。AIの持つパワーがビジネスにどのような影響を及ぼし得るのか、気になり始めているIBM iのショップにとっては、watsonxは、7月に利用可能になったらチェックしてみる価値があるオファリングであるかもしれません。
watsonxの詳細については、 www.ibm.com/jp-ja/watsonxを参照してください。