すぐに分析に利用できるデータは3割以下。AIを活用した分析に向けたデータ準備はどうあるべきか?

データに問題がないかどうか、データ品質を“丸見え化”

 IBMのデータ・カタログには、データの使用頻度や品質を分析し、そのデータが使用して問題のないレベルにあるかどうか自動スコアリングする機能も備わっている。品質レベルのスコアが表示されているため、ビジネスユーザーが間違った判断をするリスクが低くなる。

 「データ品質機能は、いわばデータの品質を“丸見え化”する機能です。定期的に対象データをモニタリングし、汚れたデータを修正する仕組みを提供しています。そのため、データの品質状態やデータのばらつき、欠損値を事前に知ることができます」(高田氏)

 また、分析に使用するデータが「そもそも正しいデータから作られているか」「正しく加工されているか」を確認するために、データの流れを可視化する機能がある。データ加工の順序やETL処理の内容が把握できるデータ・リネージュ機能により、データの発生源・流れ・加工などのプロセスを調査し可視化してデータの透明性を確保することも可能だ。全社システムのデータの流れを管理することにより、システム改修による影響範囲もわかるようになる。

 さらに調査したデータ判別ルールをETLジョブに組み込んで、データレイクの品質を向上させる機能も備えている。データ・カタログにはデータ統合ツールが組み込まれており、GUI画面を使って多種多様なデータソースに接続し、生産性・保守性の高いETLジョブが開発できるようになっている。

 「これらの機能により、新しいニーズが発生した際にどのデータを使用すべきか迅速に判断し、データ品質に問題がないこともすぐに確認できるようになります。データ・カタログの導入後は、データの準備にかかっていたワークロードを最小化して生産性向上とコスト削減を実現するだけでなく、分析精度の向上や業務への即時適用によって売上アップなどのビジネス効果をもたらします」(高田氏)

データ・カタログに基づく次世代データ・プラットフォーム

 IBMによれば、デジタル変革や、AI・データ活用を推進していく際には、このデータ・カタログの考え方もとりいれた次世代のデータ・プラットフォームが必要になるという。IBMが提唱する次世代データ・プラットフォームにおいて、データ・カタログはじめ、データの統合・品質・ガバナンスを支援するデータ準備に関わる統合データ管理の部分を担うのが「IBM InfoSphere Information Server」であり、メタデータを統合管理する共通リポジトリを中心に、データ統合に必要な機能を実現する各種ツール群によって構成されている。

 「次世代データ・プラットフォームの3要素である“ためる”、“つなぐ”、“活用する”の中で、IBM InfoSphere Information Serverは、“つなぐ”という部分を担当する製品です。データ・カタログをはじめとして、高機能ETL、名寄せ・クレンジング、データプロファイリング、ビジネス用語辞書、メタデータ管理、品質モニタリング、データ来歴影響分析などデータ統合に関するツールがパッケージングされているため、データ分析の生産性向上だけでなくガバナンス強化にも役立ちます」(高田氏)

 なお、IBM InfoSphere Information Serverにはフル機能を備えた「Information Server Enterprise Edition」のほかに、データ統合機能を提供する「Information Server for Data Integration」、データ品質機能を提供する「Information Server for Data Quality」、データガバナンス機能を提供する「Information Governance Catalog」の各エディションが用意されており、クラウドでもオンプレミスでも提供することができる。ユーザの要件に合わせて柔軟に導入することが可能だ。

 また、”ためる”、”つなぐ”、”活用する”の3要素をオールインワンでカバーしているのが、オンプレミス環境ではKubernetes基盤をベースにしたプラットフォームであるIBM Cloud Private for Data、パブリッククラウド環境ではWatson Studioというソリューションだ。これらのソリューションでもデータ・カタログが利用可能となっており、企業のニーズに合わせた幅広い選択肢が用意されている。

お問い合わせ
提供:日本アイ・ビー・エム株式会社
[PR]企画・制作 朝日インタラクティブ株式会社 営業部  掲載内容有効期限:2018年12月31日
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]