前回は、データアーキテクチャの考え方について述べた。今回は、その中身の設計、データのデザインについて解説する。
データ活用に欠かせないデータ統合
デジタル経済の発展により、さまざまな形でヒトやモノがデータでつながるビジネスエコシステムが形成されつつある。データ流通は企業内でとどまらず、企業間や個人との間で行われるようになった。また、実世界(フィジカル空間)で生み出されたIoTデータや実績データを、サイバー空間でデータ分析し活用する「サイバー空間とフィジカル空間の融合」を実現し、新たな価値を創出する活動が進んでいる。
このように“企業と企業、企業と顧客をつなげる”“サイバー空間とフィジカル空間をつなげる”ためには、様々な形式で流通するデータを統合する必要がある。
そして、データ統合を実現させるためには、統合化するためのデータのデザイン(設計)が重要であり、これこそがデジタルビジネス全体の成否を分けるといっても過言ではない。
データ統合の現状とその難しさ
データ統合自体の重要性は十数年前から多くの企業が理解しており、企業全体のデータ統合を目指すためのマスターデータマネジメントやデータウェアハウス(DWH)といった形でのデータ統合基盤構築など、データ環境の整備が進められてきた。
しかし、データ環境を整備していたとしても、実際の中身となるデータの構造は、理想的な形で整備できていない企業も多い。整備できていない要因の代表的な例は、以下のようなものがある。
- 企業内のデータが非常に膨大で、統合する時間が足りない
- 企業全体で必要となるデータが可視化できておらず、どのようなデータを統合すべきか判断できない
- データを統合する目的や基準が明確でなく、投資が継続せず、あるべき姿まで到達しない
- データ環境にあらゆるデータを格納したが、活用要件が整理できておらず、データ環境が沼地化している
- 国やリージョンごとに異なる法律、ルールに対応した統合ルールが整備できていない
- データに責任を持つ人材が不明確なため判断できない
- さまざまな業務やシステムとの調整が進まず、データ統合が頓挫している
- 取り扱いに関する基準やルールが整備できず、データ統合の弊害となっている
目指すべきデータのデザイン
データ統合に関するデザイン(設計)にはさまざまな課題があるが、多種多様な形式で流通するデータを統合するには、デザインをどう考えれば良いのだろうか。
データのデザイン方法
デザインする上で一番大事な要素は、“ビジネスとデータの関係性の写像”である。
そのためには「データモデリング」といわれる、明確に定義された手法を用いて、求められた要件に応じたデータモデルの作成が必要だ。
国際的な非営利団体であるData Management Association International刊行の「データマネジメント知識体系ガイド(DMBOK:Data Management Body of Knowledge)」では、データマネジメントの11の機能の一つとして、「データモデリングとデザイン」を挙げている。
データモデルというと、システム設計の成果物となる論理、あるいは物理データモデルという認識が一般的だが、ここでの成果物とは、エンタープライズデータモデル(企業全体のデータを記載した俯瞰的なデータモデル)やサブジェクトエリアモデル(企業全体のデータを記載した俯瞰的なデータモデル)といった俯瞰的な概念モデル図である。