Hewlett-Packard(HP)は6月に米国で開催したイベント「HP Discover 2012」で、「ビッグデータ」と「クラウド」という、近年のエンタープライズITを語る上で外すことができない重要な2つのキーワードについても、いくつかの新たな発表を行った。
Discoverの基調講演では、同社CEOのMeg Whitman氏が同社の戦略として「インフラ」「ソフトウェア」「サービス」「ソリューション」という4つの要素を挙げ、これらを最適な形で組み合わせることで、企業における課題の解決をサポートしていくという方針を明確に示した。ビッグデータとクラウドに関する発表も、この方針に沿って、それぞれのテーマに関する各要素の内容を補強するものとなっていた。
「無視できない存在」であるHadoopへの対応を強化
ビッグデータについては、インフラ面での管理性を向上する新製品に加えて、企業がビッグデータの活用を円滑に進めるためのサービス、機能を強化した分析エンジンのリリースについて触れられた。これらの組み合わせによって、企業はビッグデータを管理、そして理解し、データに基づいた意思決定や行動を行えるようになるとする。
ビッグデータの管理と分析のインフラとして、HP Discoverで発表されたのは「HP AppSystem for Apache Hadoop」である。AppSystemは、特定用途のアプリケーションを導入する際に、その展開や管理を容易にすることを目的として提供されるアプライアンス型のターンキーソリューションだ。今回、このAppSystemに、分散処理フレームワークとして人気の高いHadoopに対応したものが用意された。
HPのソリューション&戦略アライアンス担当バイスプレジデントのPaul Miller氏
HPでソリューション&戦略アライアンス担当バイスプレジデントを務めるPaul Miller氏は、ビッグデータ分野において、オープンソースプロダクトであるHadoopが「無視できない存在になっている」と指摘。一方でその展開や管理については「まだ敷居が高く、スケーラビリティや可用性の面でもエンタープライズレベルの運用は難しいケースが多い」とする。
HP AppSystem for Apache Hadoopのメリットとしては、Hadoopの導入や展開、そして管理が容易になる点を挙げる。また、高いスケーラビリティやフォールトトレランスの高さ、さらに同社の分析エンジンである「HP Vertica 6.0」との組み合わせによるリアルタイム分析が容易に実現できる点なども示された。
「AppSystem for Apache Hadoopによって、800ノードの展開を30分以内に完了することができる。各ノードのパフォーマンスについては、リアルタイムで可視化し、最適化を行うことができる。さらに、競合が提供するHadoopソリューションと比較して、3.8倍以上のパフォーマンスを引き出せる」(Miller氏)
このAppSystem for Apache Hadoopと合わせて、「サービス」として提供されるのは「HP Big Data Strategy Workshop」と「HP Roadmap Service for Hadoop」である。これらは、企業がビッグデータ活用を進めていくにあたって、その指針となる知識とロードマップを提供するものだという。
ワークショップでは、4日間のレクチャーを通じて、ビッグデータの活用方法や、そこから生み出されるビジネス機会についてのユーザーの理解を深める。後者では、Hadoopの導入と活用にあたって、企業ごとに推奨される投資の方法、タイムライン、リスク低減策などをロードマップとして作成する。「Hadoopのエキスパートが少ない現状においても、これらのサービスにより、企業は誤ったスタートを避けることができる」(Miller氏)とした。
HPが提供する情報最適化ソリューションで、ビッグデータ分析のコアとなるのは、「HP Vertica 6」そして「HP Autonomy IDOL 10」という2つのソフトウェアだ。HPでは、いずれも2011年に買収した両ソフトウェアの統合を進めており、今回のDiscoverでの発表は、その最新の成果となる。データウェアハウス的なアプローチで主に構造化データの分析を行う「Vertica」と、非構造化データに対する意味ベースでの検索や可視化を得意とする「IDOL(Autonomy)」とを組み合わせることで、企業内外に存在するあらゆる種類のデータ分析と可視化を実現する取り組みを進めている。
最新版となるHP Vertica 6 Enterprise Editionでは、「FlexStore」と呼ばれるアーキテクチャを採用。これは、IDOLやHadoopを含むさまざまなデータ管理フレームワークを統合するためのもので、クラウドやSaaS上で提供されるデータソースへの接続性も向上しているという。また、IDOL 10においてもHadoopへの対応機能を強化しており、これによってユーザーはHadoopの各ノードにIDOLのエンジンを組み込み、自動分類やクラスタリングをはじめとするIDOLの分析機能を活用できるとする。
今回のDiscoverでは、これらの製品を組み合わせた、特にマーケッター向けのビッグデータ分析ソリューションとして「Optimost Clickstream Analytics」が発表された。これは、特にコマースサイト上のクリックストリーム(訪問者がクリックしたリンクや回数などに関するログデータ)を分析し、テストやターゲティング、キーワードや広告の最適化などに活用するためのものだ。従来より、コマースサイトの収益最適化にとって有用であるとされながら、量が膨大であったために活用されないケースが多かったクリックストリームに対するツールを提供することで、データに基づいたサイト構築や意思決定へのアプローチを可能にするという。