データマートとは?他のデータベースとの関係やメリットを解説

データマートとは?他のデータベースとの関係やメリットを解説

ビジネスにデータを活用するには、データを適切に管理する必要があります。本記事では「データマート」と呼ばれるデータベースに注目して、他のデータベースとの違いやメリット、注意点などを説明していきます。

データマートは「データの小売店」

データマートという言葉の「マート」は、英語で「小売店」という意味です。スーパーやコンビニといった小売店では、多くの商品が種類ごとに整理され、整然と並んでいます。同じようにデータマート内のデータも目的や用途に応じて整理され、利用しやすいように格納されているのが特徴です。

たとえば「DMを送る」という目的のため、さまざまな項目がある顧客データから「郵便番号」「住所」「氏名」などの項目を抜き出したものがデータマートといえるでしょう。

 

データマートと他のデータベースの関係

データマートはデータベースの一部ですが、データベースには他にも「データウェアハウス」などがあります。データマートを適切に使うためには、これら他のデータベースとの相違点や関係をしっかり理解することが欠かせません。

データウェアハウス

データウェアハウスとは、簡単にいうと「データの倉庫」です。収集したデータを利用しやすいように構造化し、格納する「倉庫」のようなデータベースといえるでしょう。特定の用途に限定されていないぶん、活用の幅が広いのが特徴です。

データレイク

データレイクを直訳すると「データの湖」となります。広大な湖に大量の水が注ぎ込んでいるように、さまざまなソースから日々取得する膨大なデータを加工せずに、そのまま格納している中央ストレージリポジトリ(保管場所)がデータレイクです。

データマート・データウェアハウス・データレイクの関係

データマートとデータウェアハウス、データレイクの特徴と関係を簡単にまとめると、以下のようになります。

・データマート…構造化データから特定の目的や用途に合わせて切り出したデータを格納(データのサイズは〜100GBが目安)

・データウェアハウス…ローデータをレンジング(整形・加工)した構造化データを格納(データのサイズは100GB〜数TBが目安)

・データレイク…未加工のローデータを格納(データのサイズは無制限)

 

データマートの3つのメリット

企業がデータマートを利用することには、大きく3つのメリットが挙げられます。

メリット1:比較的安価に構築できる

最初に挙げるメリットは、構築コストの安さです。データマートに格納されるデータは、特定の目的や用途に合わせて絞り込まれています。つまりサイズが小さく、データウェアハウスと比べてシンプルです。このためデータベース構築は比較的安く、そして短期間で行うことができます。

メリット2:データを効率的に利用できる

次に、データを効率的に利用できることもメリットとしてあげられます。たとえばデータウェアハウスに格納されているデータを直接利用する場合、まずは目的や用途に応じてデータを抽出しなければなりません。しかし目的ごとにあらかじめデータマートを作成していれば、素早く効率的にデータを利用できます。

メリット3:データへのアクセスを制御しやすい

データマートには、ユーザーからのアクセスを制御しやすいというメリットもあります。たとえばデータレイクやデータウェアハウスのデータは特定の用途に絞られていおらず、大勢のユーザーが利用します。これに対しデータマートのデータは、それを必要とする特定ユーザーのみにアクセスを許可する、という運用が可能です。

 

データマートの注意点

データマートの利用は便利な反面、注意点もあります。

まず注意すべきなのは構築前の準備です。データマートは特定の目的・用途で利用されるため、あらかじめ構築前にデータ利用の目的を明確にしておく必要があります。もし目的があやふやなままデータマートを構築してしまうと使いづらいデータベースになり、後から修正の手間が発生してしまう可能性もあります。

またデータウェアハウスが「さまざまな用途に使える」のに対し、データマートの用途は限定的です。目的や用途がいくつもある場合は複数のデータマートを構築・運用することになり、結果として手間と時間がかかります。

さらに構築するデータマートが多いほど、データベース同士の整合性が保たれるよう注意しなくてはなりません。もし目的ごと(もしくは部門ごと)に使っているデータが互いに食い違ってしまうようなことがあれば、データ全体への信頼が失われてしまいます。

データマートや他のデータベース(データウェアハウス、データレイク)は、どちらかが一方的に優れているというものではなくそれぞれに長所があります。これからデータ活用を考える企業は、自社の目的やニーズ、そして予算に合ったデータベースの構築を検討すべきでしょう。

 

まとめ:データベース構築は目的・予算に応じて検討すべき

データマートは比較的安価に構築できるうえ、効率的なデータ利用やアクセス制御の面でも有利です。しかしデータ利用の目的やデータベース構築の予算などによっては、データウェアハウスやデータレイクの方が有利なケースも少なくありません。データを活用するすべての企業は、自社にとってどのデータベースが最適なのかしっかり見極めるようにしましょう。

ホワイトペーパー: 機械学習を成功に導く3つの方法

Cloudera Japan Marketing
この著者の他の記事

コメントする

あなたのメールアドレスは公開されません。また、コメントにリンクを貼ることはできません。