これからの企業経営はデータ分析に基づくものでなければならない。従ってビッグデータの活用が必要だ――。
そんな論調が主流になって久しいが、果たしてどれだけの企業が、データを活用してビジネスの変革を実現し、業界にインパクトを与えることに成功しただろうか。ましてや、過去の分析にとどまらず、これからの予測に活用しているケースとなると、まだ少数派ではないだろうか。
Hewlett-Packard Enterprise(HPE)では、列指向型データウェアハウス(DWH)向けデータベース「Vertica」を通して、より多くのデータをより高速に分析できる環境を整え、“データ駆動型組織”への変革を支援していくという。同社ビッグデータソフトウェアグループ ビッグデータプラットフォームサービス部門 最高技術責任者(CTO)のRameez MeeraSahib氏にその狙いを聞いた。
過去を知るだけでなくリアルタイムに、将来の予測を支援
SNSやRFID、Internet of Things(IoT)といった技術が相まって、今やユーザーがデバイス、マシンが生み出すデータは、過去のDWHが取り扱っていたビジネスデータとは桁違いの種類、桁違いの量に上っている。おそらく、今後も増加し続けるだろう。
Verticaは、そうした大量かつ多彩なデータを扱う前提で設計された、データ分析のためのプラットフォームだ。専門の訓練を受けたデータアナリストだけでなく、あらゆる関係者がアプリケーションを通じてリアルタイムにデータにアクセスし、分析し、より短い期間でビジネスにつなげられることも特徴だ。
Hewlett-Packard Enterprise ビッグデータソフトウェアグループ ビッグデータプラットフォームサービス部門 CTO Rameez MeeraSahib氏
より多くのデータを“データレイク”に溜め込んで分析するデータ分析市場が確立して久しい。Verticaは、過去に何が、なぜ起きたのかを明らかにするデータ分析はもちろん、さらに大量かつ多様なデータを活用して、複雑な分析を行う「高度なアナリティクス」(Advanced Analytics)や機械学習技術を活用し、「過去を把握するだけでなく、今何が起きているかを知り、そして将来何が起こるかの予測を可能にする」とMeeraSahib氏は述べた。
「“Hadoop=ビッグデータ”ととらえられた時代が続き、多くの投資がなされてきた。しかし本当にそこからメリットを出すことができるだろうか。Hadoopやデータレイクは成熟した技術であり、ある面では有用だが、より高度なアナリティクスや予測的な機械学習といったあらゆるユースケースに効果があるとは言い切れない」(MeeraSahib氏)
同氏はさらに、「先進的な企業では、データをどのように使うのかはっきりしないままデータレイクにデータを溜め込む段階から、何らかの課題を解決するため、明確な目的を持ってリアルタイムに予測、分析するシステムへの移行が始まっている。Verticaは、SQLやHadoopといった既存の技術を生かしつつ、こうしたプロセスを加速する。その上、MapReduceで複雑なカスタムコードを書く必要がなくSQLが利用できるため、より迅速に分析できる」と説明した。
さらに、パートナーのテクノロジに加えて、クラスタコンピューティングフレームワークの「Apache Spark」や分散メッセージングシステム「Apache Kafka」といったオープンソースソフトウェアを活用することで、ビジネスインテリジェンス(BI)や可視化などVerticaの分析エンジン単体では足りない部分を補い、「顧客のニーズに応えていく」と述べている。
データをビジネスの価値に変えていく手助けを
日々生み出される膨大なデータをビジネスに生かさない手はない。「課題は、どのようにデータをビジネス上の価値に変えていくかということだ。現状ではデータはサイロ化されており、アクセスできる範囲は限られている。リアルタイムにあらゆるデータにアクセスできる環境を整え、プロアクティブな分析、予測的な分析を可能にし、ビジネスプロセスを加速し、自動化していくことが重要だ。最終的には企業が飛躍し、市場に破壊的な創造をもたらして業界リーダーとなる手助けをしていく」とMeeraSahib氏は語った。
そのために、Verticaでは3つのステップからなる手法を推奨しているという。一つ目のステップは、データの価値を見定めることだ。貴金属にも金、銀、プラチナとさまざまな種類があり、中には混合することでより高い価値を生み出すものもある。
それと同じように「個々のデータの価値を見極め、どれとどれを組み合わせれば、より高い価値を生み出せるかを見出すためのプロセスと技術を提供する」(MeeraSahib氏)
次のステップでは、いつでも、どこでも、企業内の全てのステークホルダー誰もがリアルタイムに分析を活用し、洞察(インサイト)を得られるようなデータ志向型の基盤を構築することだ。このような基盤を用意することで、高度な分析や予測的分析、機械学習を活用し、インサイトを得てからビジネスにインパクトを与えるまでの時間を短縮できる。