活用すべき未来の形:ハイブリッドデータ

活用すべき未来の形:ハイブリッドデータ

by David Moxey
この記事は、2022/6/7に公開された「The Future Is Hybrid Data, Embrace It」の翻訳です。

私たちは、ハイブリッドデータの世界に生きています。過去10年間、世界中で作成され、キャプチャ、コピー、消費された構造化データの量は、2011年の1 ZB(ゼタバイト)未満から、2020年には14ZB 近くまで増加しています。驚異的な数字に思えますが、非構造化データ、クラウドデータ、マシンデータは、そこからさらに50ZB 増えた量となります。

構造化データと非構造化データのボリュームの推移グラフ

実のところ、データの総量は、2025年までに3倍近くになると予想されています。その原因は、ハイブリッドデータ、つまりクラウド、オンプレミス、エッジなど、企業が活動するあらゆる場所で生まれる膨大なデータです。実際に保存・管理されているのは、作成されたデータのごく一部で、アナリストは、2020年にはその量は4~6ZBになると見積もっています。ハイブリッドデータは大きな可能性を秘めていますが、同時に課題もあるのは明らかです。可能性を収益につなげるためには、データがどこにあろうと、そのすべてのデータの価値を活用するという能力が必要です。

今こそ Cloudera に注目するタイミングです

Cloudera にとっては、今まさに想像していた通りの未来を迎えていると言えます。ビッグデータが再び注目を集めているのです。ビッグデータの価値を世間にお伝えした企業として、これは予測していたことでした。1990年代や2000年代前半のトレンドが復活する中、この流れは単にタイミングの問題だと考えていました。しかし、今のビックデータは、あの頃のビックデータと同じではありません。ハイブリッドデータという進化を遂げているのです。今のビックデータは、ペタバイト級の構造化・非構造化データの保護、管理、分析を支援することができます。オンプレミスで1ZB近くのデータを管理下に置くことができ、これは全世界のデータ量の約20%に相当します。また、AWS、Azure、GCP など、お客様の希望のクラウドを利用することも可能です。Deloitte 社が言うように、「ハイブリッドクラウドはデファクトモデル」なのです。

自信の裏付けとなる統計データ

Cloudera は、Gartner 社の Cloud DBMS Magic Quadrant 分析において、2社のVisionary のうちの1つに選ばれています。また、クラウドDBMS製品のカテゴリである「Gartner Peer Insights Customer Choice for Cloud DBMS」では、「Gartner Peer Insights Customer Choice」として選出されました。さらに、Cloudera DataFlow は、「GigaOm Radar for Streaming Data Platforms」にて高い評価を受けています。

Gartner Peer Insights Customer Choiceのロゴ

業界を率いるアナリストは、Cloudera は、分析および運用データのユースケースにおいて、多くの著名なクラウドベンダーよりも優れていると評価しています。また、同アナリストからは、ハイブリッドおよびマルチクラウドの分析ソリューションについて、最も優れているとの評価も受けています。

3,000人以上の IT および上級意思決定者を対象とした、Cloudera 独自のエンタープライズデータ成熟度レポートでは、40%の組織が、現在ハイブリッドであるが、そのほとんどがオンプレミスであり、36%の回答者が今後18ヶ月以内にマルチクラウドのハイブリッドに移行するだろうと予測していることがわかりました。また、同調査では、IT 意思決定者の89%が、データ戦略の一環としてハイブリッドアーキテクチャを導入する組織は、競争優位性を獲得できると思っていることが明らかになりました。

データの向かう先に、アイデアが続く

今日、私たちはハイブリッドデータの向かう道を切り開いています。Cloudera は、あらゆるクラウド上のあらゆるデータからリアルタイムの洞察を得ることを可能にし、価値創造までの時間を短縮するための、迅速で十分な情報に基づく意思決定を実現します。企業は、マシンデータ、構造化データ、トランザクションデータ、非構造化データなど、あらゆるタイプのデータをあらゆる場所で管理、分析したいのではないでしょうか。ハイブリッドデータプラットフォームで、マルチクラウドとオンプレミスに対応できるのは、Cloudera だけです。データ配布、データエンジニアリング、データウェアハウス、トランザクションデータ、ストリーミングデータ、データサイエンス、機械学習など、データライフサイクル全般にわたって、インフラ間で移動可能なクラウドネイティブなデータ分析をご提供します。「一度作成すればどこでも実行できる」多機能な分析を実現する、唯一の企業、それが Cloudera なのです。

ハイブリッドデータファースト戦略で、より早く価値を提供する

企業は、どこでもデータを利用できるモダンデータアーキテクチャのためのハイブリッドデータプラットフォームを活用することで、すべてのデータの持つ価値から収益へつなげることが可能となりました。Cloudera Data Platform (CDP)  は、現在および将来のモダンデータアーキテクチャの重要な要件に対応するように設計されています。Cloudera Data Platform図

CDP は、データライフサイクル全体をカバーするポータブルで相互運用可能なデータ分析機能と、パブリッククラウド、オンプレミス、エッジで稼働する分散データ管理機能を備えた統合プラットフォームです。共通のセキュリティ、ガバナンス、メタデータ、レプリケーション、自動化により、CDP は統合システムとして運用することができます。これはまさに、業界アナリストがデータファブリック、データレイクハウス、データメッシュ、そしてこれからのデータエコシステムアーキテクチャの必須条件として推奨しているものです。

ビッグデータからクラウドデータ、そしてハイブリッドデータへと進化するにつれ、企業がデータにアクセスし、利用し、そこから価値を生み出すことはより複雑になってきています。そこで登場したのが、データレイクハウス、データファブリック、データメッシュといった最新のデータアーキテクチャです。これらの新しいアーキテクチャは、複雑さを自動的に処理するように設計されているため、IT チームが処理する必要はありません。Cloudera SDX が提供する統合データファブリックはすべての異なるデータソースをインテリジェントかつセキュアに、セルフサービス方式でオーケストレーションしてくれます。当社のお客様は、すべてのデータに対して統一された、信頼できる、包括的なビューを持つことができるようになりました。SDX は唯一、複数のクラウドとオンプレミスでこのようなことが実施できます。

オープンデータレイクハウスを提供した最初の企業として、Cloudera は、複数のクラウドとオンプレミスにまたがるクラウドネイティブなオブジェクトストアで、ストリーミングデータと保存データの両方に対する多機能分析を可能にし、お客様が自由に選択できるようにします。Cloudera はオープン性と相互運用性を優先しています。そのため、CDP のお客様がレイクハウスでお好みの分析ツールを使用できるように、Apache Iceberg を次世代テーブル形式として使用したコミュニティの取り組みを進めています。

データファブリックとデータレイクハウスアーキテクチャの要素を組み合わせることで、データを製品として扱える拡張性のあるデータメッシュを実現したい企業に対して、データ製品を所有し、結果を出す機能を提供します。マルチクラウドやオンプレミスにおいて、一貫してセキュアかつガバナンスを備えた、オーケストレーションされた方法でこれを実現できるのは Cloudera だけなのです。 Cloudera Data Platform のハイブリッド展開と集中型ガバナンスは、企業が求めるデータメッシュアーキテクチャを実現するための絶対的な基礎となります。企業は、安全で適切に管理され、アクセス可能なデータをオンデマンドで提供することが、成長の原動力になることを理解し、それを求めています。Cloudera Data Platform (CDP)  は、将来のために構築されたハイブリッドデータプラットフォームであるため、最新のデータアーキテクチャの柔軟性を提供することが可能です。また、CDPはガートナーの「Strategic Roadmap for Migrating Data Management to the Cloud [Published 21 March 2022 – ID G00746011, Analyst(s) Robert Thanaraj、Adam Ronthal、Donald Feinberg] 」で提供されているガイダンスに非常に沿うものとなっています。

「将来のデータエコシステムは、複数のクラウドやオンプレミスで稼働する分散型データ管理コンポーネントを活用し、高度に自動化された全体として扱われる必要があります。統合、メタデータ、ガバナンスの各機能が、個々のコンポーネントを結び付けます。」

CDP は、真のハイブリッドデータプラットフォームとして、「一度作成すればどこでも実行できる」機能によって、データアプリケーションの開発をより速く、簡単に、よりコスト効率よく行うことができるというメリットを、お客様へご提供します。

スピードとコントロールで成長を促進

調査の結果、上級意思決定者の90%が、データをもっと効果的に管理できれば、収益につながる機会をより多く得られると回答しています。CDPを利用して最新のデータアーキテクチャを採用し、ハイブリッドデータの価値を最大限に活用しているお客様がたくさんいらっしゃいます。その良い例が、HelloFresh 社の取り組みです。同社は、世界最大のミールキット会社で、少数の内部および外部ソースからなる典型的な集中型データ管理方法を採用していました。これはデータ管理に対する典型的なサイロ化されたアプローチでした。驚異的な成長期を遂げた同社では、データが、競争優位をもたらす重要な戦略的資産になることを認識しました。そこでHelloFresh 社は Cloudera と提携し、データメッシュを構築して、信頼できるデータ製品を組織の他の部分に提供することにしました。データメッシュのアプローチを採用することで、クリーンで統合されたデータをリアルタイムに提供し、クラウドの展開を30%高速化し、顧客維持を向上させました。現在、データメッシュにより、同社はデータのサイロをなくし、エラー率を監視し、動的なレシピ推奨を行うダッシュボードなどのように、ビジネスに大きな価値をもたらすデータ製品を生かすことが可能になりました。 

他にも多くのお客様が、最新のデータアーキテクチャを通じて、データから大きなビジネス価値を実現しており、当社はその支援を行なっています。Regions Bank は、Cloudera ベースのデータファブリックを新しいデータ製品の基盤として導入し、カスタマーエクスペリエンスの向上、効率の向上、そして顧客を維持することで年間1,000万ドル以上の節約を実現しました。Deutsche Telekom 社は、Cloudera ベースのデータレイクハウスを使用して、不正検出とサービス品質のための AI/ML 駆動型分析を強化し、顧客解約を10%削減し、同時に業務効率の50%改善を実現しました。また、HSBC Security Services 社は、データメッシュの実装により、ソースデータが存在する会計システム、フォーマット、データ構造に関係なく、標準化された純資産価値を顧客に提供することができるようになりました。

調査対象となったIT意思決定者のうち、自社がライフサイクルプロセスの全段階に関与していると回答したのはわずか12%であり、組織のデータ活用方法に関して、いかにその可能性が生かされていないのかが明らかになりました。私たちの目標は、すべてのビジネスが、より簡単な方法でより迅速に行動するために、同レベルのメリットを達成するという能力の提供です。Clouderaは、ハイブリッドデータ戦略を実現できる唯一の企業です。私たちは、あらゆるフォームファクタ、パブリックとプライベート、そしてエッジでデータを管理し、分析することができます。私たちは、データ分析のパイプライン全体を一貫して、統一された方法で制御できる、セキュリティとガバナンスのメッシュを提供します。当社のデータ分析は、「一度作成すればどこでも実行できる」クラウドポータビリティを実現するように設計されています。  そして、それを業界の誰にも真似できない規模で、実現することができるのです。

未来はハイブリッドデータです。活用しましょう

私たちの技術戦略、つまりハイブリッドデータやマルチクラウドデータに対応した、セキュアかつガバナンスを備えたデータ管理による多機能データ分析の統合というものは、業界の専門家が推奨する最新のデータアーキテクチャの実現と100%合致しています。私たちは、データと分析を誰にでも簡単にアクセスできるようにするというビジョンと、ハイブリッドデータにおけるリーダーであるという使命を持ち、その実現に引き続き取り組んでまいります。私たちは、データによって今日不可能なことも、明日は可能にすることができると考えています。貴社のハイブリッドデータの実現への旅は、私たちにお任せください。

 

E-book: IoTによる デジタル トランスフォーメーション

Cloudera Japan Marketing
この著者の他の記事

コメントする

あなたのメールアドレスは公開されません。また、コメントにリンクを貼ることはできません。