一方のトランスフォーメーションは、何らかのアプリケーション的な要素が関係する“変換”のことであり、コンバージョンに比べて難易度が高く、当初の検討からもれてしまうものが多くあると考えられる。例えば、異なる製品コード体系、区分コードの相違、あるシステムでは売り上げを20日締めで管理しているのに、別のシステムでは月末締めで処理しているといったデータの意味の違いをすり合わせて、一貫性のあるデータウェアハウスを構築するには、ユーザー開発によるアプリケーション・ロジックが必要になる。
このような、トランスフォーメーションの実装が困難であるのにはいくつかの理由が考えられるが、その最大の要因と言っていいのが、企業内で運用されている既存アプリケーションにおけるデータ設計の多様性だ。
データの持つ意味や構造の多様性は、一見、自明に思える「顧客」というデータにも存在する。法人向けに商品を販売するケースを考えた場合、営業部門から見た顧客は顧客企業の購買担当者であり、物流部門から見た顧客は、商品の送り先、経理部門から見た顧客は、請求書の発送先となる。
これら複数の「顧客」は、すべて「顧客」であり、何らかの形で統合する必要があるわけだが、それぞれの顧客(人あるいは部署)はすべて異なる可能性がある。特に、商品の送り先は、1つの発注に対して複数存在するなど、意味と同時に構造も異なる場合がある。これまで企業に導入されてきたシステムの多様性を考えると、こうしたデータの意味の多様性をコントロールするための対策を検討する必要があるのは明らかである。
またデータの“鮮度”も、データの品質を考えるうえで非常に重要な要素であることを忘れてはならない。月次の判断を行うには、前月の状況が月初めに分析できる状態になっている必要があるし、日次での判断となれば、前日の状況が翌朝には利用可能になっているべきである。必要な時に十分な鮮度を保っているデータが入手できないのであれば、ユーザーのデータ活用に対する意欲を著しく落とすことになりかねない。
さらに、ある時点で品質の高いデータを用意できたとしても、その後の継続的なデータ品質維持・向上の取り組みがなければ、データ品質は劣化してしまうということにも注意が必要である。企業活動においては、日々新たなデータが生成され、データウェアハウスに蓄積されてゆくが、その際に当初想定外のデータが入力される可能性がある。たとえば、新規取引先の追加や新製品の取り扱い開始に伴い、これまでにないコードやデータが入力される可能性が考えられる。
また、業務系システムにおける項目追加などがあった場合には、データウェアハウスにおいても項目の見直しが必要になる。また、データウェアハウスを運用していくなかで、担当者が変わることでデータの各項目が何を意味しているのか、データ同士の関連性がどうなっているのかが不明になってしまうような事態が発生すると、必要な修正作業がスムーズにできなくなってしまう。つまりデータが高品質であるとは、データが正確で最新の状態にあり、なおかつ利用しやすいように適切に構築されている状況にあることを指すのである。
最後に、BIにおいて、期待通りの成果を得るために必要なデータ品質を確保するために重要なポイントを以下にまとめる。
- 多様なデータ源 (社内外) のデータが標準化された上で統合されている
- 十分な履歴が、十分細かい粒度で、最新かつ正確な状態に維持されている
- データの属性や変換ロジックについて、適切な文書化が行われている
データ品質の維持・向上は、業務のあらゆる点で、またデータが発生してから廃棄されるまでのライフサイクル全般において、組織的に継続的に対応すべき課題なのである。
堀内 秀明(Hideaki Horiuchi)
ガートナーリサーチ ソフトウェアグループ ビジネスインテリジェンス担当主席アナリスト日本国内のデータベース・ソフトウェアなどのソフトウェア市場動向・将来予測・競合分析ならびに、ビジネスインテリジェンス・システムの製品選定、システム導入に関するアドバイスを担当。
ガートナー ジャパン入社以前は、国内大手SIベンダーにて10年間、製品調査、システム提案・構築ならびに技術支援に従事。
ガートナーが最新の情報と提言を結集するイベント「Gartner Symposium/ITxpo 2005」(2005年11月30日〜12月2日)にて『インフォメーション・アキテクチャーの役割と重要性』をテーマに講演を行うほか、2006年の「ビジネス・インテリジェンス・サミット 2006」(2月22〜23日)では、チェアパーソンを務める。