Greenplum HD EEはApache版と比較して3〜5倍の性能向上を達成したとされている。HDFS(Hadoop File System)をC言語で書き直した点が大きいようだ。また、複数プロセスのコントローラ役となるネームノードのプロセスを二重化し、チェックポイント/リスタートの機能も提供するなど、エンタープライズ級の可用性向上機能が提供されているようだ。なお、日本ではリクルートが先行顧客としてパイロットを行なっていることが発表されている。
なお、RDBMSの世界とHadoopの世界の融合という点では、まだデータ共用というレベルに留まっており密結合型の連携が行なわれているわけではない(HadoopとRDBMSの密結合という領域では、Teradataに買収されたAsterDataが一歩先を行っていると思われる)。
EMCの「ビッグデータ」戦略に残されたパズルのピース
ストレージ、そしてDBMSの両面で「ビッグデータ」向けのテクノロジを提供している点で、EMCの将来に向けた「手駒」は揃っている。
しかし、一般論として、EMCのようにテクノロジ買収を中心とする成長戦略を取る企業には、迅速なテクノロジの拡充というメリットがある一方で、テクノロジの統合という課題が生じる。その意味では、今のところIsilonの世界とGreenplumの世界はほとんど分離しており、有機的な統合が行われているとは言い難い。
これはEMCの「ビッグデータ」戦略に残された重要課題だろう。近い将来に、たとえば、Isilon上のファイルシステムをHDFSとしてマウントできるソリューションなどの実現が期待される。
Keep up with ZDNet Japan
ZDNet JapanはFacebookページ、Twitter、RSS、Newsletter(メールマガジン)でも情報を配信しています。現在閲覧中の記事は、画面下部の「Meebo Bar」を通じてソーシャルメディアで共有できます。