多くの組織では、ビッグデータとアナリティクスの民主化はあまり進んでいない。
この事実は、Forresterの主席アナリストMichele Goetz氏と、エンドユーザーにビッグデータアナリティクスツールを提供しているCambridge Semanticsで、ソリューションとプリセールスを担当するバイスプレジデント兼ファウンディングエンジニアBen Szekely氏の会話の中で明らかになった。
Goetz氏によれば、Forresterの調査に対して、67%の企業はビッグデータにアクセスできず、59%はビッグデータを統合できておらず、56%はビッグデータの更新プロセスが非常に遅いと回答したという。これは、数年にわたってビッグデータに投資し続け、その投資からもっと大きな利益が得られると期待している企業にとっては良くない知らせだ。その一方でForresterは、世界で管理されているデータの量は、4.4ゼッタバイトから44ゼッタバイトにまで増加すると予想している。
Goetz氏は「この大量のデータをすべて解釈するには、そのプロセスに知的なツールを導入し、データの消費者自身がセルフサービスでデータを使用できるようにする必要がある」と述べている。
多くの企業は同じ結論にたどり着いており、Forresterの調査では、回答企業のうち59%が、収集しているデータをさらに活用できるよう、今後12カ月間以内にデータを準備する機能を拡大するか、新たに導入すると回答している。
しかし、ビッグデータの準備プロセスに関する取り組みは遅れている。ある調査では、データサイエンティストは、業務時間の50~80%をビッグデータの収集(サイズも形式もバラバラの状態で収集される)、クリーニング、準備に費やしていることが明らかになっている。このように、データの準備作業がすでに大きな負担となっていることを考えると、この作業を民主化し、分散するのであれば、そのためのツールを用意する必要がある。
Szekely氏は、データレイクを組織内に分散させ、それぞれのエンドユーザー部門に持たせることを前提としたビッグデータ戦略について議論した。IT部門やデータサイエンティストがデータのクリーニングや準備を行う場合、第三者的な立場で、データの正規化とクリーニングの基本的なルールに従って作業を行う。しかし、営業、マーケティング、製造、調達、財務、顧客サービス、人事などの各分野に詳しいビジネスユーザーが関与する場合、単にデータをチェックするだけでなく、自らの経験に基づいてデータにビジネス的価値を付け加えることができる。
「われわれが目指しているのは、このプロセスの透明性を高めることだ」とSzekely氏は言う。「われわれは、現場が持っているデータに関する知識をデータ資産に変えたいと考えている。……企業は、組織内に分散するビッグデータサンドボックスが製品ゾーンになるようなビッグデータアーキテクチャを導入することによって、これを促進することができる」(Szekely氏)
Cambridge Semanticsなどの企業は、グラフを使用したデータ発見手法やアナリティクスを用いて、ITに詳しくないエンドユーザーでも利用できるビッグデータ準備ツールを作っている。「その目標は、エンドユーザーがデータの可視化と発見を行うことができ、自分の事業の文脈で解釈できるようにする、セルフサービス型のアナリティクス手法を作ることだ。このツールを使えば、データを組織のガバナンス上の要件に合致し、追跡可能な形で準備することもできる」とSzekely氏は言う。
データの準備とアナリティクスの作業をエンドユーザーの手に委ねて、個別にデータレイクを持たせることができれば、この分散型のプロセス(およびワークロード)によって、データについて判断するのにかかる時間を短縮できるだけでなく、多くの組織が直面している課題である、大量のデータを管理するための革新的な手段を提供することができる。
提供:iStock
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。