Hortonworksは「Apache Hadoop」を企業のIT環境にフィットさせるために本腰を入れているようだ。これが、Hewlett Packard Enterprise(HPE)との提携や、「Hortonworks DataFlow」の機能拡張、新製品リリースの頻度の変更を考え合わせて導き出される結論だ。
HadoopのディストリビューションベンダーであるHortonworksは米国時間3月1日に開催した公開ウェビナーで数々の発表を行った。米ZDNetのLarry Dignan記者は、ウェビナーの開始とともにニュースを伝えていた。その一方で筆者はウェビナーに参加した後、1時間ほどHortonworksの担当者から話を聞き、発表内容とその意味についての理解を深めた。
本記事では、その発表内容を以下の3つの領域に分けて解説する。
「Apache Spark」、そしてHPEとの提携
Hewlett Packard Labsのテクノロジストらは、「Apache Spark」の「Shuffle Engine」をC++でリライトし、最適化した。そして、これによってある種のワークロードのパフォーマンスが15倍になったとしている。HPEは、このコードをオープンソース化する(標準的なApache Sparkのコードベースを構成するものとしてチェックインする)ことを望んでおり、その方向でHortonworksと作業を進めていこうとしている。一方、Hortonworksは「Hortonworks Data Platform」(HDP)で、Hadoopベンダーとして「Apache Spark 1.6」をディストリビューションに含めた初のベンダーになったと語っている。
「Hortonworks DataFlow」
また、「Apache NiFi」をベースにしたHortonworksのData-in-Motion(通信経路上を流れるデータ)パッケージである「Hortonworks DataFlow」(HDF)も、「Apache Storm」と「Apache Kafka」を含めるようになった。これまでであれば、顧客はHDP上でこれら2つのコンポーネントを入手する必要があったため、Apache Stormおよび/あるいはApache KafkaとともにApache NiFiを使用する場合には、HDPとHDFの双方のサブスクリプションを入手しなければHortonworksからのサポートを受けられなかった。しかし今では、他のベンダーのHadoopディストリビューションとともにHDFを使用し、HortonworksからHDF関連のサポートを受けられるようになっている。
もう1つ述べておくことがある。同社はImpetus Technologiesの「StreamAnalytix」(筆者は最近この製品に関する記事を執筆している)をスムーズにHDFに統合するためにImpetusと提携したとも発表している。