OLTPの業務系DBとOLAPの情報系DBはそれぞれ別のものとして活用されている。業務系DBからETLツールなどを介して情報系DBにデータが取り込まれる。SAPのHANAとOracleのExadataは、この業務系DBと情報系DBを統合して、業務系DBのデータの変化をリアルタイムで情報系DBで感知できるということが可能になるとしている。
ビッグデータの解決策としての「Hadoop」
BIとDWHの市場環境に目を向けると、2010年は“Big Data(ビッグデータ)”が重要なキーワードとして注目されている。DWH大手Teradataのユーザー企業が中心になって開かれるイベント「Teradata PARTNERS 2010」でも、このビッグデータにいかに対応すべきかが話題になっている。
ビッグデータへの企業の取り組みとして、先進的と言えるのがオークションサイト大手のeBayだ。Teradataの大口ユーザーでもあるeBayは、ペタバイト級のデータに対して「Hadoop」をベースにしたシステムを活用している。
米Googleが考案した分散並列処理フレームワークであるMapReduceをベースに開発されているのが、オープンソースソフト(OSS)のJavaソフトウェアフレームワークのHadoopだ。Hadoopはこの2〜3年で大きな注目を浴びており、2009年にも米国で関連イベントが開催されている。
処理対象となるデータがテラバイト級、ペタバイト級と大きくなっても、スケールアウトで処理能力を直線的に拡張できるHadoopは、日本国内でも注目されている。プリファードインフラストラクチャー(PFI)とぷらっとホームが関連サービスを手掛けている。
またSIer大手のNTTデータもHadoopの構築・運用サービスを提供している。NTTデータはHadoopディストリビューションベンダーの米Clouderaとも提携している。NTTデータが面白いのは、Hadoopを活用したアプライアンス「Lindacloud for Hadoop」の提供を始めていることだ。同社の前身である日本電信電話公社時代のメインフレーム以来のハードウェア参入として、業界から大きな注目を浴びている(また同社の子会社NTTデータ先端技術はOSSのETLツールやデータ統合ツールを手掛けるTalendと提携している)。
このビッグデータ周辺で今後、プレゼンスを発揮するのではないかと予想されるのがSAS Instituteだ。同社はBIベンダーからビジネスアナリティクス(BA)のベンダーへと姿を変え、業界で大きなプレゼンスを獲得している。SASはTeradataなどのDWHベンダーと提携しており、その技術力は高く評価されている。
企業向けITの世界で“バズワード”になる可能性が十分に高いビッグデータの定義は、ほかのバズワードと同様に曖昧なところがある。しかし、ビッグデータには、ソーシャルメディアから次々と発生するデータも含まれる。SASはソーシャルメディアを分析し、マーケティングに活用するSaaSを展開している。また顧客間で構築されるコミュニティの隠れた関係性を分析できるソリューションも提供している。
ビッグデータをどのように企業の業務に取り入れてビジネスに貢献させるかは、いまだ手探りの状態だが、SASの今後の展開は注目されるところだ。
2011年の日本国内は、ビッグデータとその解決策としてのHadoopにより大きな注目が集まるのではないかと個人的に予想している(ただ、その一方で「ストリームデータ処理」や「ストリームコンピューティング」での日立やIBMの取り組みも気になっており、この技術を取り込むことで、BIやDWHのリアルタイム化がより進むのではないかと思っている)。
アイ・ティ・アール(ITR)がまとめているように、この数年で市場での競争は激化している。ここまで見てきたように、企業の買収劇が今後も続く可能性があるが、技術の進展が大きく期待できる。拡大と競争による市場の活性化は、ユーザー企業にとって悪いことではないはずだ。