すぐに分析に利用できるデータは3割以下。AIを活用した分析に向けたデータ準備はどうあるべきか?

 ビッグデータを収集・分析してビジネスに活用しようという機運が高まる中、データの品質や整合性に課題を抱える企業が増えている。とりわけAIを活用して高度なデータ分析を行いたくても、すぐに利用できるデータがないために投資対効果が十分に得られないという悩みが多く聞かれる。そうした課題の解決策として日本アイ・ビー・エム(以下IBM)が提唱するのが“データ・カタログ”という手法に基づく次世代データ・プラットフォームだ。

分析に利用できるデータは3割以下、データの準備に大きな課題

日本アイ・ビー・エム クラウド事業本部 アナリティクス事業部 第二テクニカルセールス シニアITスペシャリストの高田 和広氏
日本アイ・ビー・エム クラウド事業本部 アナリティクス事業部 第二テクニカルセールス シニアITスペシャリストの高田 和広氏

 ビッグデータ/アナリティクス市場の拡大が続く中、AIを活用してデータ分析に取り組もうとする企業の間から、さまざまな課題の声が上がり始めている。データ分析や統計解析のノウハウやスキルを持つ人材の不足、データ分析を行うために必要な予算の不足といった課題とともに最も多いのが、データの品質や整合性に問題があるということだ。

 データの品質や整合性に問題があるということは、そのままの状態ではデータを分析しても有用な結果が得られないことを意味する。IBMによれば顧客のデータの中で、すぐに分析に利用できるデータは30%以下のことも多いという。つまり、70%以上のデータは“AI Ready”ではないということだ。これはプロジェクトごとに分析基盤がバラバラで、データを準備してすぐに利用できる状態になっていないからだとIBMでは見ている。

 IBM Watsonをはじめとする数多くのデータ分析プロジェクトを手掛けてきた経験を持つ、日本アイ・ビー・エム クラウド事業本部 アナリティクス事業部 第二テクニカルセールス シニアITスペシャリストの高田 和広氏によると、AIを活用するためには順番に踏むべき6つのステップがあると言う。それぞれのステップにはさまざまな課題があるが、特に解決を急ぐべきなのが、最初の3つのステップ「データ連携・アクセス」「データの検索・信頼性確認」「データの準備・加工」の各ステップの課題だ。

図:AI活用のための6つのステップ 図:AI活用のための6つのステップ
※クリックすると拡大画像が見られます

 「AIの活用には、当然のことながらデータの準備が必要です。ところが現状では、データ収集・蓄積、データ整形・精査など、データを準備するだけでワークロード全体の8割を占めると言われています」(高田氏)

 高田氏は、これほどまでに工数を割かなければならないのは、「データの所在がわからない」「データが正確でないため使えない」「データの加工に時間がかかる」といった要因があるためだと言う。

 「例えば、データの所在がわからないために、いざ利用する際に欲しいデータが見つからなかったり、必要なデータをIT部門からタイムリーに入手できなかったりすることがあります。また、欠損値や外れ値が混じっているなどデータが不揃いで、複雑な関数を利用した加工処理を行わなければならないことも、データの準備に手間取る理由です」(高田氏)

ビジネス用語を使って、必要なデータをセルフサービスで検索

 では、データの準備を効率化するには、どのようにすればよいのだろうか。高田氏は“データ・カタログ”を導入することが近道だと話す。

 「データ・カタログとは、ビジネスユーザーが自分で分析目的に合う正しいデータを探索し、アクセスできるようにするための機能のことです。これを取り入れることで、データの所在地や透明性を管理することが可能になります」(高田氏)

 IBMのデータ・カタログは、クラウド/オンプレミスを問わず多種多様なシステムに分散するデータを仮想的にデータレイクのようにまとめ、Watsonテクノロジーの応用によって自動的にメタデータを収集・整備し、カタログで統合管理するデータ基盤だ。カタログにはビジネス用語やIT資産などの情報も一元化されているため、ビジネスユーザーは必要なデータをセルフサービスで手軽に入手することができる。

 「特に役立つのが、ビジネス用語を使って逆引きできる辞書機能です。ビジネス部門とIT部門では、同じデータを指すのに別の用語を使っている場合が往々にしてあります。そうした用語を取りまとめることで、ビジネスユーザーは普段使っている用語を使って必要なデータの所在情報、データ管理者などを自分自身で検索し、すぐに見つけられます」(高田氏)

 カタログに登録されている用語については、例えばMicrosoft® Office (Word®、Excel®)ドキュメントに表示されている文字列からカタログを呼び出したり、BIソフトウェアであるCognos Analyticsのレポートに表示されている項目からカタログを呼び出し、表示されている項目の意味を知ることもできるようになっている。

お問い合わせ
提供:日本アイ・ビー・エム株式会社
[PR]企画・制作 朝日インタラクティブ株式会社 営業部  掲載内容有効期限:2018年12月31日
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]