~ Greenplum HD - Greenplum DBの特徴 高速化・信頼性向上・使いやすさ向上 ~
第2回目では、オープンソース版であるApache Hadoopと比べ、Greenplum HDが優れいている3つのポイントについて紹介します。
■Greenplum HD Enterpriseの強み■
オープンソースのApache Hadoopではなく、Greenplum HD Enterprise Edition(以下、EE)を使うメリットを改めて整理します。
まず第1点目は非常に高速であることです。Apache Hadoopと比べて3-5倍のパフォーマンスを持っています。Apache HadoopはJavaベースで書かれていますが、Greenplum HDはC/C++言語によりフルスクラッチで書き直されており、Javaのオーバーヘッドがなく、ガベージコレクションの心配もありません。これにより高速な処理を実現しています。
2つ目は高い信頼性です。Apache Hadoopですと、ネームノード、JobTrackerの部分が単一障害点になっていました。Greenplum HDではネームノードもJobTrackerも標準で冗長化される仕組みを持っています。これにより単一障害点の課題を解決しています。
3点目は使いやすさの点です。先ほど監視管理機能のモジュールを持っているというのを紹介しましたが、それ以外にもNFSマウントができるなどの改良を加えています。これまでは、例えばWebサーバが書き出すログをHadoopに持ってきたい場合、掃き出されたログ・データをHadoopのHDFSに転送して処理をしていました。これに対し、Greenplum HD EEではNFSマウントが可能ですので、Webサーバのログの書き出し先をGreenplum HD EEに設定することができます。こうすることでログが書き出された時点でHadoop上に置けるため、すぐに処理することができます。このような点が使いやすさを向上しているポイントです。
更に、使いやすさを向上させているポイントは、Greenplum DBと組み合わせて利用可能な点です。Greenplum DBがHadoopとの連携ができるようになっているので、Greenplum DBからHadoopのHDFS上のデータを取り出してクエリを実行し、分析をかけることができるのです。
また、先ほど紹介した通りアプライアンス型のDCAを提供していることにより、迅速な導入とハードウエアも含めた一括保守が可能ですので、この点も使いやすさを向上させています。
ここからは、Greenplum HD EEが持つ優位性を更に掘り下げて紹介します。
続きはこちらから (»リンク)
EMCジャパンのTech Communityサイト (»リンク) では、ストレージや情報管理に関する最新技術を多数紹介しています。
企業ブログ
-
【EMC Tech Communityサイト】事例紹介 Vol.62 | グローバル・カンパニーにおけるパフォーマンスやストレージ使用率の向上とコスト削減を両立させる取り組み
アメリカのオハイオ州Olmstedに本社を置き、アメリカ、カナダ、メキシコ、中央アメ...
2012-10-31

