HadoopベンダーのHortonworksは、アイルランドのダブリンで現地時間4月13日~14日に開催した「Hadoop Summit」で多くのことを発表した。発表そのものにも重要な内容が含まれており、この記事ではその内容を紹介する。
ただしこれらの発表は、「一般向け」のHadoop界が2つに分割されつつある現状を示していることを念頭に置いておいてほしい。HortonworksとClouderaが各ディストリビューションに導入している独自のコンポーネントは多くの場合、同じようなニーズや要件を満たすものになっている。
Hortonworksの発表
まず、重要な内容から紹介しよう。「Pivotal HD」を引っ提げて、3年前にHadoopのディストリビューション競争に参入したPivotalは、HortonworksのHadoopディストリビューションである「Hortonworks Data Platform(HDP)」を再販することになった。
実はPivotalは、Hadoopに関する野心を少しずつ後退させていた。まず、同社はPivotal HDをOpen Data Platformイニシアティブ(ODPi)の仕様に準拠させることを発表した。その後同社は、自社のデータコンポーネントをすべてオープンソース化したが、これには同社のSQL-on-Hadoopエンジン「HAWQ」や、HAWQが派生する元になった、GreenplumのMMPデータウェアハウス製品まで含まれていた。
そして今度は、Pivotal HDにまで幕引きし、「Pivotal HDP」というブランドに移行しようとしている(Hortonworksのプレスリリースでは、Pivotal HDPはHortonworks Data Platformと100%同一のものであると明言されている)。その一方で、Pivotalのディストリビューションコンポーネントであり、現在は「Apache HAWQ」となった「HDB」は、「Hortonworks HDB」としてHortonworks陣営に加わり、HDPのコアでアドオンとして利用できるようになる。これが何を意味しているかはお分かりだろう。
HDPからDMXへ
Hortonworksが行ったもう1つの発表は、独自に再販事業を始めるということだ。具体的には、同社はメインフレームベースのETL処理や、その他のレガシーのETL処理をHadoopと統合する、Syncsortのソフトウェア「DMX-h」の再販を始める。
この話題については、あまり深く分析できていない。最近プライベートエクイティファンドのClearlake Capitalによって買収されたSyncsortは、(ややニッチではあるが)興味深いテクノロジを有する優良企業だ。Hortonworksはエンタープライズ市場での競争力を強化しようとしており、顧客に対して直接Syncsortのテクノロジを提供できるようにすることは、筋が通っているように見える。
テクニカルプレビューの公開
次に、Hortonworksは、同社のData Governance Initiativeから生まれた「Apache Atlas」(インキュベート中)と、同社が2年前にXA Secureを買収した際に取得した技術を元にした「Apache Ranger」(インキュベート中)を統合したこと発表した。Atlasはデータガバナンス機能を提供する。一方で、RangerはHadoopスタックのさまざまなコンポーネントに対するロールベースのアクセス制御を可能にする。