Amazon Redshiftとは?
Amazon Redshift(以下Redshift)は、AWSのBigdataソリューションの一つとして、ビジネス向けのDWH(データウェアハウス)をター ゲットとした「Data Warehouse as a Service」をフルマネージドで提供します。
数クリックでクラウドに展開する事ができるDWHアプライアンスとして、とても魅力的なサービスです。
Redshiftのメリットと特徴
Redshiftを用いて企業向けDWHを構築する事には、どのようなメリットがあるのでしょう?
筆者の観点にすぎませんが、以下に挙げるメリットがあると考えています。
数百GB~数PBまでのデータ保持と拡張性
バックアップやチューニングが既に含まれている
カラムに格納するデータ性質に応じたデータ圧縮によるストレージ利用効率の良さ
超並列演算(MPP)とカラムナデータベース(列指向データベース)による高速なクエリ
ライセンス不要の低廉な従量課金
PostgreSQLのクエリ互換で学習が容易
カラムナデータベース(列指向データベース)とは?
一般的なRDBMSは行指向であり、主に特定の行をランダムアクセスし、トランザクション処理や更新などの性能を重視しています。行指向データー ベースは近年求められているBI分析処理での、集計、分析はそこまで得意としていません。その為、カラムナデータベースでは、主にカラムに対するクエリを 重視してブロック化する事で主に集計や統計関数の性能を向上させています。
また、ブロック化されたカラムに対して圧縮されている為、追加・更新・削除の際には、ブロックに対し展開・格納・再圧縮が行われています。よって、頻繁な追加、更新、削除をRedshiftはあまり得意としません、主にデータ分析処理に集中して進めていく事になります。
(この続きは以下をご覧ください)
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。