EMCジャパンは5月26日、重複除外バックアップストレージ「Data Domain」の性能を向上させるソフト「EMC Data Domain Boost」(以下、DD Boost)を発表した。重複除外を分散処理させる手法を採用しており、同社ではData Domainのパフォーマンスを最大で2倍に高速化できるとしている。DD Boostは、同時に発表されたData Domain用の最新OS「DD OS 4.8」のオプションという位置づけで提供される。
一般的な重複除外システムでは、データを送るソース側、あるいはデータを受け取る側のどちらか1カ所で重複除外を実行していた。しかし、DD Boostでは、重複除外の処理をバックアップサーバとストレージに分散させることができるようになったという。
Data Domainは従来、バックアップデータを受け取ると、データをセグメント化し、IDを割り当て、保存すべき「ユニーク」なものとそれ以外に分類した上で「ユニーク」と判断されたIDだけを転送するしくみだった。
一方、DD Boostでは重複除外処理のアルゴリズムをライブラリ化し、バックアップサーバにプラグインする形式で、重複除外処理を分散。バックアップサーバ側で、セグメント分け、ID割り当てなどの作業を実行できるようにしている。EMCジャパン、BRS事業本部 システムエンジニアリング部長の首藤憲治氏は、「DD Boostを使えば、Data Domainのスループットは1.5〜2倍になる」と話す。
この分散処理には、さらに利点があるという。首藤氏は「バックアップサーバは、重複除外処理を受け持つことで負荷が増えるが、バックアップサーバの負荷が最も大きくなるのはデータの転送処理。重複除外処理は、これを減らすことができ、実際にはバックアップサーバの負荷は20〜40%ほど軽減できる」と指摘する。
DD Boostのもう一つの特徴は、バックアップソフトでレプリケーションを管理できるようになることだ。データを複数の遠隔地に配置したData Domainに転送できる。たとえば、バックアップサーバから一度Data Domainにデータを保存して、そこから、遠隔地などにある別のData Domainにレプリケーションするというような場合、これまでは、バックアップサーバ側は、実質的には関与できなかった。しかし、今回発表されたDD Boostを利用すると、バックアップサーバ側から直接レプリケーションの命令を出せるため、初回のバックアップデータ、レプリケーションした分、いずれもバックアップサーバが管理できるようになる。これにより、バックアップと災害復旧環境の管理を一元化することなどが可能になる。
DD Boostが対応するバックアップソリューションとしては、シマンテックの「NetBackup」「Backup Exec」がある。将来的には「EMC NetWorker」にも対応する予定という。
また今回、DD OS 4.8で新たに追加された「Data Domain Global Deduplication Array (DD GDA)」 は、Data Domainのハイエンド機種「Data Domain 880」の複数のコントローラ間でグローバルな重複除外を実行し、単一のストレージプールにデータを保存することができる。デュアルコントローラのパフォーマンスを利用して、最大で12.8テラバイト/時のスループットを実現し、論理バックアップ容量は最大14.2ペタバイトに達するという。首藤氏は「大規模データセンターなど、超大型の需要に応えるもの」だと話す。
そのほか、DD OS 4.8では、Data Domain 880でのストレージ容量が拡張され、従来の2倍となる実効容量142.5テラバイト、論理容量では7.1ペタバイトのストレージを使用できるようになった。最大180のバックアップジョブをサポートし、最大180カ所までのリモートオフィス用のレプリケーションターゲットとして利用することが可能となった。