EMCジャパンは3月5日、データ分析アプライアンスの新製品「EMC Greenplum Data Computing Appliance Unified Analytics Platform(DCA UAP) Edition」の販売を開始した。税別の参考価格はクォーターラックモデルで5000万円から。同社と同社パートナー企業から提供される。
新製品は、2011年1月から提供している「EMC Greenplum DCA」の機能と性能を強化。統計分析や予測モデル、機械学習に使用される、分析に最適化された形で拡張性が高くなるように、システムを再設計している。Greenplum DCAと同様に大規模並列処理(Massively Parallel Processing:MPP)アーキテクチャを採用。データウェアハウス専用ソフトウェアの「Greenplum Database」をベースにしている。
Greenplum DCA UAPは、Greenplum Databaseのほかに「Hadoop」処理向けに「Greenplum HD」、Greenplumのパートナー企業から提供されるビジネスインテリジェンス(BI)ツール、データを変換するためのETLツール、分析アプリケーションを単一のアプライアンスに統合している。Hadoopはオープンソースの分散並列処理フレームワーク。この仕組みを取ることで、構造化データと非構造化データの両方を連携して分析できるようになっているという。
Greenplum Databaseは、専用のハードウェアに依存せずにコモディティ化したハードウェアで稼働することが前提。Greenplum DCA UAPは、サーバやストレージ、ネットワークスイッチ、OSなどのコンポーネントをGreenplumの開発部門が構成や設定を最適化した状態で出荷する。導入後の設定やチューニング作業が不要となり、短期間で業務に利用可能になると説明している。GUIで運用を管理するツール「Greenplum Command Center」が導入済みであり、運用管理が容易になるとメリットを強調している。
新製品は、1ラック構成の場合で1時間あたり16Tバイトと、従来製品よりもデータロード性能が60%向上していると説明。データスキャニング性能は70%、多重ワークロードに対して145%の性能向上を実現しているとメリットを強調。スケールアウト型の構成となっており、ハードウェアを追加するだけでテラバイトからペタバイトまで、1000倍の拡張性が実現したと優位性を説明している。処理容量の増加や複雑化した分析に応じて、拡張できるという。
Greenplum DCA UAPでは、重複排除技術を搭載したストレージシステム「EMC Data Domain」を統合している。Greenplum Databaseモジュールを1時間あたり13Tバイトまでバックアップ、リカバリできるという。スケールアウト型NASストレージ「EMC Isilion」との統合で、スナップショットやミラーリング、バックアップなどのデータ保護もできる。