IBM i HA/DRのテストはお済みでしょうか。もしかしてインストールしてあるだけですか。
IBM i の高可用性(HA)および災害復旧(DR)対策の状況に関して、リスクのある状態なのか、すぐに対応可能な状態なのかが分かる1つの質問があります。すなわち、前回、フル ロール スワップをテストしたのはいつですか?
驚くことに、HA/DR対策を講じているとは言うものの、何か月間も、時には何年間も、それらのソリューションのテストを実施していないことをあっさり認めてしまうITマネージャーやシステム管理者は非常に多いようです。なかには、DRシステムは実装したものの、一度も動作確認していないというケースもあるようです。
Gartner社の調査によると、災害復旧は企業にとって極めて重要な課題となっているのにもかかわらず、過去12か月以内にDR計画のテストを実施したという企業は全体の半数以下だったということです。
残念ながら、いざ災害が発生したときに、「インストールされている」からといって、「すぐにスワップを行える」わけではありません。
レプリケーション ソフトウェアは、特にコンプライアンス要件が厳しい業界の場合、多くのIBM i のショップにとって、インストールしてチェック済みマークを付ける必要がある項目となっています。インストールし終えたら、これで大丈夫と安心してしまいがちですが、本当に大丈夫なのでしょうか。
レプリケーションが機能しているように見えても、その裏では、良からぬ事態が静かに進行している場合もあります。たとえば、次のような状況です。
- 新しいオブジェクトがレプリケーションから抜け落ちている。
- ユーザー プロファイルと権限が同期されていない。
- ロール スワップのスクリプトが古くなっている、テストされていない、または不完全。
- アラートなしで、レプリケーションが停止されている。
ある組織で実際に起こった例を挙げれば、ロール スワップの際に、バックアップ サーバー側にあった重要アプリケーションのキーが無効なキーであることが初めて分かったというケースがありました。これは、以前に行われたハードウェアの変更が原因でした。また、別のケースでは、最初のロール スワップは成功したものの、バックアップ環境と本番環境との通信構成の違いのせいでレプリケーションの遅延が発生し、予定されていた本番環境へスワップを戻す機会が失われてしまいました。
今の時代、テストというのは、実施の是非を選べるものではなくなっていますが、フル ロール スワップ テストの実施を避けようとするIBM i のショップは多いようです。考えられる理由としては、以下のものがあります。
- 自信がない
「うまくいかなかったらどうしよう」 - スキルがない
「古参の管理者が退職したため、やり方が分かる人が1人もいない」 - ダウンタイムが心配
「本番環境に影響が出た場合に対応する余裕がない」 - ツールが複雑
「ソフトウェアが非常に複雑化しているため、下手に触るのはリスクが大きい」
残念ながら、これらの理由は、それだからこそテストを実施しなければならない理由でもあるのです。手順が複雑過ぎるから、人手が掛かり過ぎるから、文書化されていないから、といった理由でテストを実施できないのだとすれば、肝心の、実際の緊急事態発生時にも、やはり複雑過ぎて頼りにならないのは間違いありません。
どのレプリケーション ソリューションでもテストを簡単に行えるというわけではありません。たとえば、以下が必要となる場合です。
- 手作業での複雑なスクリプティングが必要(基本的なスワップ タスクを実行する場合であっても)。
- IPL、ネットワーク再構成、またはサード パーティの支援。
- シミュレーションおよびライブ テストの両方で計画のための時間および長い時間枠。
- ローカル環境またはアプリケーションについての詳細な知識。
結果として、スワップのテストは、「次の四半期に実施」あるいは「後日実施」といった具合に先延ばしにされがちです。結局、その日がやって来ることはないのです。だからこそ、Maxavaはまったく異なるアプローチを採用しています。
Maxavaでロール スワップが簡単になる理由
Maxava HAは、迅速かつ柔軟で、非破壊的なテストをサポートするように最初から設計されています。ロール スワップ テストは、日常的なIT業務プロセスの一部として実施されるべきであり、年に一度のドキドキするようなイベントとして実施されるべきものではないと私たちは考えます。
他とは違う、Maxavaの特長は以下の通りです。
- ロール スワップ シミュレーション は、数分で完了でき、本番環境に影響を及ぼしません。
- フル ロール スワップ は、自動コマンド スクリプト機能を利用して(または利用せずに)実行できます。これによりプロセスを迅速化および簡略化できます。
- 明快なレポート機能 により、何が成功し、何が失敗し、何に注目が必要かを把握することができます。
- 緻密な管理機能 により、スワップの手順を環境に合わせて簡単に調整することができます。
- 監視およびアラート機能 により、深刻化しないうちに確実に問題を把握できます。
一言でまとめると、より少ない労力で、より自信を持って、より頻繁にテストを実施できるようになるということです。そして、そのことが重要なのは、リハーサルほど弱点を明らかにできるものはないからです。
Maxavaの「Ready To Role Swap Audit」サービス
適切なツールが準備されていても、強靱なHA/DR態勢を構築するためには、多くの組織が必要としている支援はまだまだあります。Maxavaの「Ready to Role Swap Audit」(ロール スワップ対応監査)サービスは、まさにそのために用意されたものであり、同期されていてすぐにロール スワップを行えることを認証するように設計された、Maxavaサービス チームによって提供されるMaxava肝いりのサービスです。
Maxava「Ready to Role Swap Audit」サービスでは、以下を行うことができます。
- ダウンタイム リスクの低減
プロアクティブ評価を実施することにより、重大なフェイルオーバー イベント発生時の予期せぬ障害や遅延の発生を予防することができます。 - 問題の特定と解決
問題が見つかった場合は、ロール スワップの完了を妨げる可能性のある例外事象についての詳細なリストを提供します。 - 問題解決方法を選択可能
特定された問題を社内で修正するか、Maxavaのエキスパートによる修復サービスに依頼するか選ぶことができます。 - エキスパートによる検証
HA/DR環境がロール スワップ対応であることを確認し、それを証明する認証書が発行されます。
テストの実施は、ただの望ましい業務慣行ではなくなっており、ますます当たり前に求められるものとなりつつあります。規制当局や監査機関からも、DR計画のテストの実施、手順の文書化、復旧目標、およびテスト完了記録など、DR対応の証拠の提示が求められるようになっています。一部の業界では、テストを実施していないことがコンプライアンス違反につながり、場合によっては制裁金が課されることさえあります。また、企業幹部も、より良い質問を尋ねています。すなわち、「どれくらい早くオンラインに戻ることができますか?」、そして「それを証明しましたか?」
本当はHA/DR対応できていない5つのサイン
以下の5つの項目に照らして、あなたの会社の現状を正直に評価してみてください。
- 前回、ロール スワップ テストを実施したのは6か月以上前。
- スワップを実行する方法を知っているのは1人のみ。
- 以前に実施したテストの明快な成否レポートがない。
- 手順書の内容が不完全、情報が古い、そもそも存在しない。
- システム、アプリケーション、または構成を変更したが、HA/DR構成または計画が更新されていない。
1つでも思い当たる節があるようなら、今こそ行動すべき時です。
Maxava HAのような定評あるツールと、Maxavaサービス チームの専門知識を組み合わせることによって、あなたの会社のHA/DRは、インストールしたらチェック済みマークを付けるだけのものから、実際に利用できる、周到に準備された、繰り返し使える機能へと変身することができるのです。