なお、上の定義の(2)は、分析の要件から必然的に生じるものだ。業種にもよるが一般的な傾向分析には最低1年間分のデータが必要であることが多い。また、(3)もデータウェアハウスの定義として挙げられることが多いが、現実には単一サブジェクトだけで構成されるデータウェアハウスも多い(たとえば、前述のWal-Martのデータウェアハウスでは売上データだけを格納している)ことから、あまり本質的な要素とは言えないだろう。
データウェアハウスの価値
前述のように、データウェアハウスの特長は、いかなる情報分析の要件にも対応できる点にある。すなわち、アプリケーション中立性こそがデータウェアハウスの最大の価値だ。現時点および将来の多様な分析要件に対して、再構築なしに対応できる。情報系アプリケーションの統合、および、データ統合が促進される点もデータウェアハウスの価値だ。
各アプリケーションが個別にデータベースを管理している状況では、ほぼ確実にデータの不整合が生じる。同じ照会要求を行っても、システムにより返ってくる答が異なる状況となる。全社的データウェアハウスの採用により、このような状態を避け、「ただひとつの真実」(single version of truth)が提供される環境が実現できる。
なお、アプリケーション統合という点ではSOAとデータウェアハウスは相互補完的な存在だ。SOAはサービス(業務部品)間のメッセージのやり取りで統合を行う。SOAは、トランザクション系アプリケーションや対話型アプリケーションの統合には本質的に適するが、大容量のデータの分析を伴うアプリケーションには向いていない。このような目的にはデータウェアハウスが適している。
データマートとデータウェアハウスの違い
ここで、データウェアハウスと関連するテクノロジとして、データマートについても説明しておこう。データウェアハウスがアプリケーション中立な存在であるのに対して、データマートは、特定アプリケーション向けに構築されるデータベースである点が両者の本質的な違いだ。なお、結果的に、データマートでは、パフォーマンス向上のためにデータのサマリや非正規化が行われていることが多い。
アプリケーション要件ごとに個別のデータマートを構築してしまうと、データの不整合の問題が生じやすい。この問題を解決するためには、全社的データウェアハウスを構築し、そこからデータマートへのデータ抽出を行う方法がある。
これを、従属型データマートと呼ぶ。このような構成により、データウェアハウスによるデータ一貫性のメリットとデーマートによるパフォーマンス向上のメリットを享受できるようになる。この意味で、データウェアハウスとデータマートは相互補完的なテクノロジだ。
BIとデータウェアハウスの関係
BIとはエンドユーザーがシステムと対話しつつ情報分析を行うテクノロジの総称だ。BIとデータウェアハウスは全く異なるテクノロジだが、両者は相互補完的だ。BIなきデータウェアハウスも考えられる。たとえば、データウェアハウスのデータを抽出して定型的レポートの作成を行っている場合などである。
一方、データウェアハウスなきBIも考えられる。限定的な少量データ(たとえば、アンケートの結果)に対する対話型の分析を行っている場合である。しかし、どちらのケースも両テクノロジの可能性をフルに発揮しているとは言い難い。
データウェアハウスに存在する大量データをBIにより対話型で自在に分析することで、初めて企業はテクノロジの可能性を最大限に発揮できる。なお、現実の実装では、パフォーマンス上の考慮から、データウェアハウスのデータの一部をデータマートに抽出して分析するという形態が一般的になるだろう。
BI、データウェアハウス、そして、データマートは、企業にとって真に柔軟な分析系システムを構築するための最強の組み合わせと言えよう。