Amazon Web Services(AWS)は米国時間11月28日、クラウドからデータウェアハウス(DWH)をサービスとして提供する「Amazon Redshift」の限定プレビューを公開した。ペタバイト級までのデータに対応する。
既存の自社で管理するDWHは、大きなデータセットの管理に大きな時間とリソースが必要になる。ローディングやモニタリング、チューニング、バックアップの取得、障害からの復旧は複雑にならざるを得ない。DWHシステムの構築と管理、拡張にかかるコスト負担も大きくなってしまう。そのため、大企業はDWHへの高額なコスト支払いを断念し、中小企業の多くはハードウェアとソフトウェアのコストが高いことからDWHの機能を使うことができなかったと説明している。
AWSが提供するRedshiftは、容量のプロビジョニング、クラスタの監視、バックアップ、パッチの適用とアップグレードなどDWHの設定から運用、拡張に必要なすべての作業を管理する。性能改善や容量拡張でクラスタを拡張させる操作は簡単であり、システムを停止させることがないという。
Redshiftは、継続的にクラスタの状況を監視し、必要となるあらゆるコンポーネントを自動的に置換する。「AWS Management Console」で数回クリックするだけで起動でき、数百ギガバイトからペタバイト以上まで拡張できると説明。既存のDWHシステムの価格の10分の1となる、テラバイトあたり年間1000ドル以下で使用できるとコストの低さを強調している。
Redshiftでは、既存のDWHや分析ワークロード向けデータベースより高い性能を出すために列(カラム)型データストレージや高度の圧縮、高性能のI/Oなどの技術を採用しているという。安価なノードでクラスタを構成、クエリを分散すると同時に並列に処理することで、高い性能を得られるとメリットを説明してる。JaspersoftやMicroStrategyといった、SQLベースの汎用的なビジネスインテリジェンス(BI)ツールに対応している。
サービスでは、2Tバイトか16Tバイトの2種類のノードタイプを利用できる。2TバイトのDWHは1つのクラスタを100ノードまで拡張可能。価格は1時間あたり0.85ドルから提供され、最大ペタバイト以上まで拡張できる。リザーブドインスタンスの価格は、1時間あたり0.028ドル、もしくは1Tバイトにつき1年で1000ドルとなっている。