マスターデータの役割と管理方法とは?MDMの基本についても解説

マスターデータの役割と管理方法とは?MDMの基本についても解説

企業が利用するデータには「マスターデータ」と呼ばれるデータが存在します。マスターデータにはバラつきが生じやすく、一定の品質に保つにはMDM(マスターデータマネジメント)が欠かせません。本記事ではマスターデータとMDMの基本的な内容について解説していきます。

マスターデータとは

マスターデータ(master data)とは、企業が構築するデータベースにおいて基礎情報となるデータのことです。たとえば「顧客マスター」「商品マスター」「給与マスター」などと呼ばれるデータがこれにあたります。

社内でさまざまなシステムを利用している場合でも、それぞれのデータベースでは共通のマスターデータを参照するのが基本です。

マスターデータの重要性

マスターデータは業務で利用するデータを一元的に管理します。社内で業務システムを使用する際はマスターデータと紐付けることで入力の無駄が省けますし、データに変更が生じた場合はマスターデータを更新することですべてのデータベースに変更が反映され、システム同士のデータの整合性が保たれます。

マスターデータには品質管理が必要

一方マスターデータには継続的な品質管理が欠かせません。というのも、マスターデータにはしばしばデータのバラつきが発生するからです。

たとえば誤字脱字や全角・半角の混在、企業名の表記のゆれ(かな表記、漢字表記、英字表記など)、更新されていない旧住所や都道府県名の有無、日付表記のゆれ(西暦、和暦など)のように、例を挙げていけばキリがありません。もちろん「まったく同じデータ」の重複も問題です。

データのバラつきは、ビジネス活動でデータを収集・加工する限り発生する可能性があります。つまりマスターデータの品質を維持するためには、常にデータの鮮度を高く保つよう管理を続けなくてはならないのです。

マースターデータ管理のイメージ

MDM(マスターデータマネジメント)について

マスターデータを管理するプロセスはMDM(マスターデータマネジメント/マスターデータ管理)と呼ばれます。

MDMの役割と機能

MDMの目的はマスターデータを統合し、効率的に管理することです。MDMが正しく行われている企業ではマスターデータが常に最新の状態に維持され、さらに複数のシステムの導入にともなう「データのサイロ化(データが他のシステムと連携せず孤立すること)」も防げます。

MDMの代表的な機能として挙げられるのは「データクレンジング」と「名寄せ」です。データクレンジングとは破損したデータや表記のゆれなどを探し出し、削除、修正、正規化などを行う作業のことで、データクリーニングとも呼ばれます。

一方の名寄せは、データベースごとにバラつきが発生したコード(データを識別・分類するためにデータ本来の名前とは別に割り当てる記号)を検知し、統一コードを生成することです。

MDMではこれらの作業を一定期間ごとに行うことが求められます。

MDMとMDMシステム

マスターデータの管理にはMDMシステムが使用されますが、MDMとMDMシステムは厳密には同じではありません。MDMはあくまでデータ管理のプロセスを指す概念であり、MDMシステムはMDMのステップの一部として用いられるソリューションです。

MDMシステムはさまざまなベンダーから提供されていますが、その多くは以下のような特徴を備えています。

・マルチドメイン

ひとつのMDMシステム上で複数のドメインや、ドメインをまたぐクロスドメインのマスターを可視化する機能です。マルチドメインに対応するMDMシステムでは、複雑なシステム間の連携をシンプルに理解できます。

・マルチスタイル

MDMシステムの基本となる4つのスタイルに対応していることです。4つのスタイルについては次の項目で説明します。

・リアルタイム&セキュリティ

オンデマンドでマスターデータを参照したり、各システムにマスターデータを配信する機能です。これによりリアルタイムなデータ利用が可能になるだけでなく、参照経路や配信経路を一本化することでセキュリティも向上します。

・ワークフロー

MDMを実施する人やルールを管理する機能です。またMDMのプロセスを可視化し、改善するためのツールとしても利用されます。

MDMシステムの4つのスタイル

MDMシステムは4つのスタイルに分類されます。

配信型(中央集権型)

システムが共通して使用するマスターデータを作成し、それを配信する形式のMDMです。トップダウンのスタイルにより、コントロールのレベルが高いことが特徴となります。

集信型(データ活用型)

各システムごとに作成されたマスターデータを集約・統合・選別することにより、社内共通のマスターデータを作成するMDMです。

共存型

集信型と同様に社内共通のマスターデータを作成し、それを各システムに配信して(システム側でもマスターデータを変更できるようにして)大規模な分散利用を可能にするMDMです。

レジストリ型

MDMシステム側にマスターデータの本体を置く代わりに、システムごとにマスターデータのコードを読み替える対応表を管理するMDMです。実装に時間がかからないため多くのシステムで利用されています。

まとめ:マスターデータの価値はMDMによって決まる

マスターデータは業務の効率化やシステム同士の整合性を保つ上で欠かせません。しかしマスターデータの品質に保つにはMDMが必要です。適切なMDMシステムの選択と定期的なMDMの実施により、マスターデータの価値を最大限に発揮するようにしましょう。

モダンデータウェアハウスが直面する3つの最大の問題

Cloudera Japan Marketing
この著者の他の記事

コメントする

あなたのメールアドレスは公開されません。また、コメントにリンクを貼ることはできません。