あらゆる企業にとって「ビッグデータ」の活用が、生き残りと成長のために必須のスキルとなりつつある。しかし、大量のデータを高速に処理して活用する環境を作っていくにあたり、技術的な課題に直面することも多い。ヒューレット・パッカード(HP)は高速なデータ分析に特化した「HP Vertica」というデータベース製品を通じて、企業のビッグデータ活用を強力に支援している。「HP Vertica」の特長とメリットを紹介しよう。
あらゆる企業にとって「ビッグデータ」活用が必須に
「ビッグデータ」という言葉を聞くようになって久しい。社会の中で生みだされるデータの種類や量は驚異的なスピードで増加を続けている。まさに「情報爆発」という表現がふさわしい環境の中、企業にとっては、この爆発的に増加を続けている「データ」をいかに有効活用できるかが、市場での競争に勝ち、成長を続けていくために必須のスキルとなりつつある。
企業はこれまでもITシステムを駆使して、そこで生まれるデータを活用する方法を模索してきた。例えば、業務システムが生みだすトランザクションデータをデータベース(DB)に蓄積し、その中から必要なものをデータウェアハウス(DWH)のようなアプローチで取り出して集計、分析するといった取り組みもそうだ。月次や週次、さらには日次で自社の状況を把握し、そこから経営上の意思決定を行うといった形での「情報活用」は、多くの企業で行われている。
しかし、社会生活全般でITの活用範囲が広がることで、意思決定に用いるべきデータの量は格段に増えた。さらに、そこから分析結果を出すまでのスピードも短縮が求められるようになった。企業にとって「情報活用」が当たり前のものとなった中で、今後もそれを強力な「武器」として使い続けるためには、これまでと比べて桁違いに多いデータを、より高速に、短いタイムスパンで処理し続けられる環境が必要になっているのである。
「大量」かつ「高速」なデータ処理につきまとう課題
ビッグデータ時代における情報活用を考える際に直面するのは、大量のデータを高速に分析処理するためのDB基盤にまつわる課題だ。従来の一般的なDB(RDBMS)は、その構造的な宿命として、特にデータ量が増えた場合に、集計処理や分析処理を行う場合のパフォーマンスが悪化するという問題を抱えている。
この問題自体は今に始まったことではない。情報活用にあたって、データ分析処理を高速に行うためのソリューションを、多くのITベンダーはそれぞれのアプローチで発表してきた。いわゆる「DWHアプラインアンス」のような、ソフトウェアとハードウェアの両面から、分析処理の高速化を図った製品もそのひとつだ。
DWHアプライアンスのようなソリューションを利用することで、たしかに分析処理は従来のRDBMSなどに比べて高速に行えるようになる。しかしながら、分析対象のデータが数テラバイト、ペタバイト単位の大規模なものへと膨らんでいくと、それを処理するシステムのコストも急速にかさんでいく。多くの企業にとって、分析するデータの「量」と、処理の「パフォーマンス」。さらに、導入や運用、将来的なスケールアップにかかる「コスト」のバランスをどう考えるかというのは、ひきつづき悩ましい課題なのだ。
ヒューレット・パッカード(HP)では、ビッグデータ時代に対応した情報活用プラットフォームとして「HAVEn」を提唱している(図参照)。これは、企業内外に存在するあらゆるタイプの大規模データを、セキュリティを考慮しつつ蓄積、共有、活用していくためのフレームワークを示したものだが、この中で「大量の構造化データをリアルタイムに分析」するためのコンポーネントとして位置づけられているのが「HP Vertica」である。