by Travis Campbell
この記事は、2022/08/09に公開された「An Introduction to Disaster Recovery with the Cloudera Data Platform」の翻訳です。
この10年間、企業の効率的な運営にデータとデータドリブン型の洞察を統合させることが急激に増加し、それをうまく行っている企業は競争力が高まっています。私たちのお客様は、この洞察がもたらす意思決定のスピードに慣れてきています。データは、長期的な戦略と、分刻みの運用も必要となる日々の業務において大変重要です。
Cloudera Data Platform (CDP) は、可用性が高く信頼性と回復力のある方法で実行する必要がある、ビジネスクリティカルな分析プラットフォームになっています。データプラットフォームは、もはや特別なプロジェクトや科学実験ではありません。お客様は今や、アプリケーションが何をするものであれ、アプリケーションスタックに企業として必要な動作を期待しているのです。メインフレームやレガシーデータウェアハウスのワークロードをインポートする際、以前のシステムと関連する依存関係の回復力を超えないまでも、満たすことができるプラットフォームが期待されています。
CDP Private Cloud、CDP Public Cloud、またはそのハイブリッドな組み合わせに関わらず、最初のリリース以来、多くのお客様がCDP製品に移行されました。現在、お客様がその新機能とビジネス変革にもたらす価値を活用し、そして「CDP を活用するにあたり次は何をするのか」という段階に入っていることを理解しています。
なぜディザスタリカバリに注目すべきなのか?
ディザスタリカバリと事業継続の計画は、主にリスクを管理し、軽減することに重点を置いています。特にデータ保護やコンプライアンスに厳しい規制業界のお客様からは、当社の技術戦略の専門家に、「もし大惨事が起きてデータプラットフォームが破壊される恐れがある場合はどうすればいいのか」という質問が日常的に寄せられます。その答えは簡単です。今は、単一のデータクラスタ、単一のクラウド、シンプルなインフラストラクチャを超えて、堅牢で耐障害性の高いアーキテクチャへと進化しており、障害事象を乗り越えてお客様のビジネスを継続させることができます。目標は、運用上の危機が発生したときに、お客様のデータ主導の意思決定への影響を最小限に抑えることです。そのためには、障害を考慮し、それを軽減し、市場の採用によって検証された CDP 実装のための標準を構築する必要があります。
CDP Disaster Recovery Reference Architecture
Cloudera は、CDP Disaster Recovery Reference Architecture (DRRA) の正式リリースを発表しました。DRRA は、Cloudera Data Platform の信頼性、回復力、リカバリについてどのように考えるべきかに焦点を当て、プラットフォームや顧客全体で収集した学習内容を説明する「生きたドキュメント」です。
この最初のリリースでは、製品ラインに適用される業界の共通定義、データプラットフォームのデザスタリカバリおよび事業継続計画について考える際にお客様が合わせるべき業界標準、堅牢なデータプラットフォームの実装時に考えるべきガイドラインと災害シナリオの初期セットに焦点を当てています。さらに、さまざまなコンポーネントのディザスタリカバリ準備の現状と、それぞれの具体的なリカバリ戦略についても説明しています。
CDP Disaster Recovery Reference Architecture は、CDP Reference Architectures マイクロサイト内の公開ドキュメントで入手できます。
使用する用語と標準の重要性
業界や組織の規模を問わず、お客様と一緒にディザスタリカバリの設計と戦略に取り組んでいるうちに、専門用語の使い方が人によって異なることに気がつきました。そのため、一貫性を持って繰り返しアイデアを伝えることが課題となりました。特にディザスタリカバリの場合は、ニュアンスも影響も異なるため、間違った表現をしてしまうと混乱を招きます。混乱で済めば良い方で、最悪の場合、お客様に大惨事への備えについて、誤った安心感を与えてしまう可能性がありました。
Cloudera では、事業継続のオペレーションをカバーする2つの業界標準に沿うようになりました。1つ目のISO 27031:2011 は、インシデント対応に関わるプロセスや手順を説明するのに役立ちます。これには、インシデント対応プロセスの構築に役立つPlan (計画)、Do (実行)、Check (評価)、Act (改善) のライフサイクルが含まれます。2つ目のNIST 800-34は、米国連邦政府の組織におけるコンティンジェンシープランニングの一般的なガイドラインを提供するものです。これらは高度な技術を要するものではありませんが、継続計画を成功させるために必要な構造およびプロセスの枠組みを提供するものです。
RPO (Recovery Point Objective) やRTO (Recovery Time Objective) といった用語の違いや、7段階の災害復旧モデルにおけるポイントインタイムリカバリ (Tier 4) と2相コミット・トランザクション・インテグリティ (Tier 5) の機能的影響について理解することが不可欠です。
その先のステップとは
ハイブリッドモデルでは、使用量が非常に多い場合にクラウドに切り替えることで、プライマリ障害時のディザスタリカバリに特に高い費用対効果を発揮します。スタンバイシステムは、Data Lake Scaling などの新機能を使用したフェイルオーバーシナリオのためのバースト可能なコンピュートで、典型的な期間のストレージ要件を満たすように設計することが可能です。
Clouderaは、ディザスタリカバリの実装を容易にするために、製品とプロセスの両面で改善を続けています。今後のリファレンスアーキテクチャの更新では、オペレーショナルデータベースやデータウェアハウスのユースケースに地理的に分離したクラスタを実装するなど、特定のユースケースに焦点を当てた実装パターンの例を説明する予定です。たとえば、次の図のようにアクティブ / パッシブ、地理的に分散したディザスタリカバリクラスタのペアのアーキテクチャ図を統合し、共通のアプリケーションゾーン、データの取り込みと分析、およびシステム内のレプリケーションの移動方法を示します。この例では、車両遠隔測定のユースケースがあり、車両のIoTデータをシステムに取り込み、予期せぬ機械的故障を防ぐために、お客様のエンジニアリングスタッフが継続的に確認する車両メンテナンス分析を行っています。ディザスタリカバリ計画により、不測の事態が発生した場合でも、メンテナンス分析を継続することができます。
さらに、以下のような製品の改良も続けています。
- Replication Managerの機能を拡張し、Apache Ozoneオブジェクトストレージをカバー(今年後半にリリース予定)、大規模で高密度なデータストレージに関するお客様のディザスタリカバリ要件をさらにサポートする
- CDP Public Cloud におけるコアサービスと、Data Lake や Data Hub サービスなど特定の重要なデータサービスのマルチアベイラビリティゾーンデプロイメントを提供
- オペレーショナルデータベースなどのコアデータサービスのヒーリング、リカバリ、スケーリング、リバランスを自動化
まとめ
企業がデータに関する経験を積み、データを頼りにするようになればなるほど、データはビジネスの継続的な成功に不可欠な要素になります。この10年間で、データおよびデータ支援の洞察を提供するプラットフォームは、可用性があり、信頼性が高く、堅牢である必要があることがわかりました。ディザスタリカバリを理解した次のステップは、モダンデータアーキテクチャに向けたプロセスになります。
さらに詳しく知りたい場合は、CDP Disaster Recovery Reference Architecture をお読みいただき、弊社のアカウントチームやプロフェッショナルサービスチームにお問い合わせください。貴社のデータ活用のお役に立てるようご支援いたします。ご連絡をお待ちしております。
その他のリソース