EMC、データ分析専用機に新製品--非構造化データも連携して分析

田中好伸 (編集部)

2013-03-06 15:25

 EMCジャパンは3月5日、データ分析アプライアンスの新製品「EMC Greenplum Data Computing Appliance Unified Analytics Platform(DCA UAP) Edition」の販売を開始した。税別の参考価格はクォーターラックモデルで5000万円から。同社と同社パートナー企業から提供される。

 新製品は、2011年1月から提供している「EMC Greenplum DCA」の機能と性能を強化。統計分析や予測モデル、機械学習に使用される、分析に最適化された形で拡張性が高くなるように、システムを再設計している。Greenplum DCAと同様に大規模並列処理(Massively Parallel Processing:MPP)アーキテクチャを採用。データウェアハウス専用ソフトウェアの「Greenplum Database」をベースにしている。

 Greenplum DCA UAPは、Greenplum Databaseのほかに「Hadoop」処理向けに「Greenplum HD」、Greenplumのパートナー企業から提供されるビジネスインテリジェンス(BI)ツール、データを変換するためのETLツール、分析アプリケーションを単一のアプライアンスに統合している。Hadoopはオープンソースの分散並列処理フレームワーク。この仕組みを取ることで、構造化データと非構造化データの両方を連携して分析できるようになっているという。

 Greenplum Databaseは、専用のハードウェアに依存せずにコモディティ化したハードウェアで稼働することが前提。Greenplum DCA UAPは、サーバやストレージ、ネットワークスイッチ、OSなどのコンポーネントをGreenplumの開発部門が構成や設定を最適化した状態で出荷する。導入後の設定やチューニング作業が不要となり、短期間で業務に利用可能になると説明している。GUIで運用を管理するツール「Greenplum Command Center」が導入済みであり、運用管理が容易になるとメリットを強調している。

 新製品は、1ラック構成の場合で1時間あたり16Tバイトと、従来製品よりもデータロード性能が60%向上していると説明。データスキャニング性能は70%、多重ワークロードに対して145%の性能向上を実現しているとメリットを強調。スケールアウト型の構成となっており、ハードウェアを追加するだけでテラバイトからペタバイトまで、1000倍の拡張性が実現したと優位性を説明している。処理容量の増加や複雑化した分析に応じて、拡張できるという。

 Greenplum DCA UAPでは、重複排除技術を搭載したストレージシステム「EMC Data Domain」を統合している。Greenplum Databaseモジュールを1時間あたり13Tバイトまでバックアップ、リカバリできるという。スケールアウト型NASストレージ「EMC Isilion」との統合で、スナップショットやミラーリング、バックアップなどのデータ保護もできる。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]