第2回 データは精度と鮮度が命〜データ品質の重要性〜 - (page 2)

堀内秀明(ガートナー ジャパン)

2005-11-09 21:06

 一方のトランスフォーメーションは、何らかのアプリケーション的な要素が関係する“変換”のことであり、コンバージョンに比べて難易度が高く、当初の検討からもれてしまうものが多くあると考えられる。例えば、異なる製品コード体系、区分コードの相違、あるシステムでは売り上げを20日締めで管理しているのに、別のシステムでは月末締めで処理しているといったデータの意味の違いをすり合わせて、一貫性のあるデータウェアハウスを構築するには、ユーザー開発によるアプリケーション・ロジックが必要になる。

 このような、トランスフォーメーションの実装が困難であるのにはいくつかの理由が考えられるが、その最大の要因と言っていいのが、企業内で運用されている既存アプリケーションにおけるデータ設計の多様性だ。

 データの持つ意味や構造の多様性は、一見、自明に思える「顧客」というデータにも存在する。法人向けに商品を販売するケースを考えた場合、営業部門から見た顧客は顧客企業の購買担当者であり、物流部門から見た顧客は、商品の送り先、経理部門から見た顧客は、請求書の発送先となる。

 これら複数の「顧客」は、すべて「顧客」であり、何らかの形で統合する必要があるわけだが、それぞれの顧客(人あるいは部署)はすべて異なる可能性がある。特に、商品の送り先は、1つの発注に対して複数存在するなど、意味と同時に構造も異なる場合がある。これまで企業に導入されてきたシステムの多様性を考えると、こうしたデータの意味の多様性をコントロールするための対策を検討する必要があるのは明らかである。

 またデータの“鮮度”も、データの品質を考えるうえで非常に重要な要素であることを忘れてはならない。月次の判断を行うには、前月の状況が月初めに分析できる状態になっている必要があるし、日次での判断となれば、前日の状況が翌朝には利用可能になっているべきである。必要な時に十分な鮮度を保っているデータが入手できないのであれば、ユーザーのデータ活用に対する意欲を著しく落とすことになりかねない。

 さらに、ある時点で品質の高いデータを用意できたとしても、その後の継続的なデータ品質維持・向上の取り組みがなければ、データ品質は劣化してしまうということにも注意が必要である。企業活動においては、日々新たなデータが生成され、データウェアハウスに蓄積されてゆくが、その際に当初想定外のデータが入力される可能性がある。たとえば、新規取引先の追加や新製品の取り扱い開始に伴い、これまでにないコードやデータが入力される可能性が考えられる。

 また、業務系システムにおける項目追加などがあった場合には、データウェアハウスにおいても項目の見直しが必要になる。また、データウェアハウスを運用していくなかで、担当者が変わることでデータの各項目が何を意味しているのか、データ同士の関連性がどうなっているのかが不明になってしまうような事態が発生すると、必要な修正作業がスムーズにできなくなってしまう。つまりデータが高品質であるとは、データが正確で最新の状態にあり、なおかつ利用しやすいように適切に構築されている状況にあることを指すのである。

 最後に、BIにおいて、期待通りの成果を得るために必要なデータ品質を確保するために重要なポイントを以下にまとめる。

  • 多様なデータ源 (社内外) のデータが標準化された上で統合されている
  • 十分な履歴が、十分細かい粒度で、最新かつ正確な状態に維持されている
  • データの属性や変換ロジックについて、適切な文書化が行われている

 データ品質の維持・向上は、業務のあらゆる点で、またデータが発生してから廃棄されるまでのライフサイクル全般において、組織的に継続的に対応すべき課題なのである。

堀内 秀明(Hideaki Horiuchi)
ガートナーリサーチ ソフトウェアグループ ビジネスインテリジェンス担当主席アナリスト
日本国内のデータベース・ソフトウェアなどのソフトウェア市場動向・将来予測・競合分析ならびに、ビジネスインテリジェンス・システムの製品選定、システム導入に関するアドバイスを担当。
ガートナー ジャパン入社以前は、国内大手SIベンダーにて10年間、製品調査、システム提案・構築ならびに技術支援に従事。
ガートナーが最新の情報と提言を結集するイベント「Gartner Symposium/ITxpo 2005」(2005年11月30日〜12月2日)にて『インフォメーション・アキテクチャーの役割と重要性』をテーマに講演を行うほか、2006年の「ビジネス・インテリジェンス・サミット 2006」(2月22〜23日)では、チェアパーソンを務める。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]