HDFに目を向けると、2つの興味深い点が見えてくる。それらはストリーミングデータがホットになっているという点、そしてそれとともにApache Kafkaに光が当たっているという点だ。Apache NiFiもクールなテクノロジと言えるが、Apache Kafkaをバンドルせずにストリーミングデータパッケージをリリースするのはユーザーの目には奇異に映るとともに、Apache NiFiとApache Kafkaを併せて使うためにHDPのサブスクリプションを要求するというのは、ベンダーロックインという誤った方向にユーザーを導く可能性もある。Apache Kafka(そしてApache Storm)をHDFにバンドルすることで、こういった問題が無くなるとともに、「Cloudera Distribution including Apache Hadoop」(CDH)上で標準化している顧客に対してHDFを販売できるようになるという利点が付加される。
まとめ
これらの発表をまとめると、管理可能なリリースの頻度と、企業のデータセンターを問題なく管理できるシナリオ、拡張されるとともに簡素化されたストリーミングデータへのアクセス、エンタープライズビッグデータ関連のワークロードへの対応準備を整えるApache Sparkへの拡張といった、理にかなったスタックが用意されるというものになる。
HDPとHDFの組み合わせにより、真のエンタープライズ向けIT製品ができあがり、HDF自体は競争上の優位に立てる武器となる。これによって、新規株式公開(IPO)時の半分以下に落ち込んでいる同社の株価に奇跡が起こるとまでは言えないが、この動きは正しい方向に向けて注意深く考え抜かれたものであり、今後の業界の動きを決めるものになりそうだ。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。