Clouderaが取り組むべきことはまだまだある。例を挙げると、同社は新しい「Cloudera Data Science Workbench」向けのオーケストレーションエンジンとして、「Kubernetes」を用いてコンテナを日和見的に使用している。MapRは、コンテナのサポートによってコアプラットフォームを拡張し、データエンジニアやBI関連のエンドユーザーからエンタープライズアプリケーションや開発者コミュニティーに至るまで手を広げてきている。ClouderaもMapRの後を追うべきなのだろうか?
データレイクを目的としたデータ統合についてはどうだろうか?これによってデータのカタログ化が可能になるものの、今のところはデータプレパレーションやマスターデータ、ライフサイクルの管理がサードパーティーの手に委ねられている。現時点では市場が発展途上であり、クライアントベースにおいてはデータレイクの採用がまだ始まったばかりであるため、この戦略は筋が通っている。しかし、データレイクがインストールベースでより一般的になっていった場合、Clouderaの顧客がこのプラットフォームに対してデータ統合機能を期待するのは自然な流れと言えるのではないだろうか?
Clouderaは先見性のある買収を実施しており、それによって顧客はさらに多くを求める可能性もある。2014年に買収したGazzangは、エンタープライズグレードの暗号鍵管理をもたらし、その成果は外部鍵ストレージを用いたHDFSの暗号化にとどまっていない。また、この記事でも解説しているように、1年前に買収したSense.ioはData Science Workbench向けのコアテクノロジをもたらしている。SQLクエリの最適化を目的として2年前に買収したXplain.ioからの実質的な成果はまだ目にしていないが、Clouderaのクラウド戦略が軌道に乗った暁には、クラウド顧客が「Amazon Web Services」(AWS)や「Microsoft Azure」に支払っている毎月の料金を引き下げられるだけの知的財産をXplain.ioが提供してくれるはずだ。
クラウドについては?
Clouderaの顧客らはアナリストらを前にして、クラウドが長期的なビジョンであると語っていた。現在のところ、個人を特定できる情報(PII)をはじめとする機密データの取り扱いに問題が残っている。Clouderaも既に取り組みを開始しているこの弱点、すなわち自らによる暗号化制御の必要性については、いずれの顧客も強調していた。なお、データの匿名化を実施している顧客もいれば、機密データを社外に保持する時間に厳しい制限を課している顧客もいる。
とは言うものの、クラウドへ向かう動きはプレートテクトニクスと同様、ゆっくりと着実に起こっている。これは今まさに起こっている動きであり、勢いは当分衰えそうにない。Clouderaは、同社の顧客のなかでここ1年、クラウドの採用が幾何級数的に増加していると報告している。他のHadoopプロバイダーも同じようなことを語っている。
筆者が主席アナリストを務めているOvumはレポートで、Hadoopはその複雑さゆえに、普及にはマネージドクラウドというソリューションが必要だと述べるとともに、2018年末までにクラウドにおけるグリーンフィールド(まっさらな)アプリが50%を超えるという変曲点を迎えると予想している。この予想は、Clouderaの顧客らの話を聞いた後では、少し大胆過ぎたかもしれないとも思える。しかし、クラウドへと向かう動きは始まっており、それはハイブリッドというかたちとなるだろう。つまり、オンプレミスのクラウドは当面消え去らないということだ。