【EMCジャパン Tech Communityサイト】 「ビッグデータ活用でビジネス変革を実現。企業向け次世代Hadoopソリューション Greenplum HD」 Vol2

EMCジャパン株式会社

2011-10-19

~ Greenplum HD - Greenplum DBの特徴 高速化・信頼性向上・使いやすさ向上 ~

第2回目では、オープンソース版であるApache Hadoopと比べ、Greenplum HDが優れいている3つのポイントについて紹介します。


■Greenplum HD Enterpriseの強み■


オープンソースのApache Hadoopではなく、Greenplum HD Enterprise Edition(以下、EE)を使うメリットを改めて整理します。


まず第1点目は非常に高速であることです。Apache Hadoopと比べて3-5倍のパフォーマンスを持っています。Apache HadoopはJavaベースで書かれていますが、Greenplum HDはC/C++言語によりフルスクラッチで書き直されており、Javaのオーバーヘッドがなく、ガベージコレクションの心配もありません。これにより高速な処理を実現しています。


2つ目は高い信頼性です。Apache Hadoopですと、ネームノード、JobTrackerの部分が単一障害点になっていました。Greenplum HDではネームノードもJobTrackerも標準で冗長化される仕組みを持っています。これにより単一障害点の課題を解決しています。


3点目は使いやすさの点です。先ほど監視管理機能のモジュールを持っているというのを紹介しましたが、それ以外にもNFSマウントができるなどの改良を加えています。これまでは、例えばWebサーバが書き出すログをHadoopに持ってきたい場合、掃き出されたログ・データをHadoopのHDFSに転送して処理をしていました。これに対し、Greenplum HD EEではNFSマウントが可能ですので、Webサーバのログの書き出し先をGreenplum HD EEに設定することができます。こうすることでログが書き出された時点でHadoop上に置けるため、すぐに処理することができます。このような点が使いやすさを向上しているポイントです。
更に、使いやすさを向上させているポイントは、Greenplum DBと組み合わせて利用可能な点です。Greenplum DBがHadoopとの連携ができるようになっているので、Greenplum DBからHadoopのHDFS上のデータを取り出してクエリを実行し、分析をかけることができるのです。
また、先ほど紹介した通りアプライアンス型のDCAを提供していることにより、迅速な導入とハードウエアも含めた一括保守が可能ですので、この点も使いやすさを向上させています。


ここからは、Greenplum HD EEが持つ優位性を更に掘り下げて紹介します。


続きはこちらから (»リンク)


EMCジャパンのTech Communityサイト (»リンク) では、ストレージや情報管理に関する最新技術を多数紹介しています。

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]