テラデータのDWH新ハイエンドモデルに見るI/Oボトルネック解決策

田中好伸 (編集部)

2011-05-20 15:55

 日本テラデータは5月17日、データウェアハウス(DWH)製品の最上位機種「Teradata Active Enterprise Data Warehouse(Active EDW)」の最新モデル「Teradata Active Enterprise Data Warehouse 6680」と「Teradata Active Enterprise Data Warehouse 6650」の販売と出荷を開始した。価格は最小構成でActive EDW 6680が1億7000万円から、Active EDW 6650が1億円からとしている。

 Active EDW 6680は、ソリッドステートドライブ(SSD)とハードディスクドライブ(HDD)のハイブリッド型ストレージを標準で搭載したハイパフォーマンスモデル。SSDとHDDを組み合わせて格納できるデータ容量は4テラバイト~36ペタバイト。一方のActive EDW 6650はストレージはHDDだけだが、将来的にSSDとのハイブリッド型ストレージにアップグレードすることができる。格納できるデータ容量は4テラバイト~92ペタバイトだ。

 Active EDWシリーズのこれまでのハイエンドモデルであるActive EDW 5650とActive EDW 6680を比較すると、設置面積と消費電力を最大75%削減でき、単位データあたりのパフォーマンスは4倍に向上しているという。Active EDW 5650とActive EDW 6650を比較すると、設置面積と消費電力を最大25%削減できると、そのメリットを強調している。

 日本テラデータの丹隆之氏(マーケティング統括部プロダクト・マーケティング&マネジメント部部長)は、Active EDW 6650のもう一つのメリットとして「旧世代システムとの“共存”で継続的に投資を保護できる」ことを挙げている。この共存とは、異なる世代のノードを同じシステム内で結合するテラデータ独自の機能であり、Active EDW 6650と1世代前のActive EDW 5650や2世代前のActive EDW 5600などを高速相互接続技術である「BYNET」で結び、システムを拡張できる。Active EDW 6650はシステム内に6世代までの共存をサポートしている。

HDDがシステムのボトルネック

 2006年ごろからマルチコアCPUが本格的に活用されるようになっているが、その一方で「HDDのパフォーマンス向上が見られない」(丹氏)。そこで課題となっているのが「CPUパワーにディスクのパフォーマンスが追いついていけなくなってしまっている」(丹氏)ことだ。HDDがシステムのI/Oのボトルネックになっているという状況である。企業システム一般に言えることだが、データ処理性能が特に重要視されるデータウェアハウスでは特に大きな課題となる。テラデータではSSDを搭載することで、この課題を解決しようとしている。

 「それではいっそのこと、ストレージのすべてをSSDにしてしまえばいい」となるところだが、米Teradataの最高技術責任者(CTO)であるStephen Brobst氏は、すべてをSSDにすることには「不経済」として否定的だ。「データに“種類”があることを想定していない」(Brobst氏)からだ。

 ここで言うデータの種類とは、ホットとウォーム、コールドという3つだ。ホットデータは頻繁にアクセスされるデータであり、コールドデータがほとんどアクセスされないデータであり、ウォームデータがその中間に位置付けられる。つまり、データの“温度”にあわせて蓄えるストレージも使い分けられるべきというのがテラデータの回答だ。 「他社ではSSDをキャッシュとして活用している。これはオンライントランザクション処理(OLTP)にはいいのだが、DWHに向いていない」(Brobst氏)

 テラデータでは、データ温度の分布を測定するツールである「IOCNT」を提供している。これは、どのディスク領域がどれだけの回数アクセスされているかを測定するものであり、一定期間データ温度の分布を測定することで、適切なストレージ構成の計画を支援できると説明している。ホット、ウォーム、コールドはそれぞれどれくらいのパーセンテージなのかが分かり、ホットデータのためにどれだけのSSD領域が必要かを明らかにすることができる。Active EDW 6680について、データ温度の割合に応じて最適なハイブリッドの構成をサポートしており、データの領域と温度に対するニーズを満たすために4つの構成を提案している。

 データに温度があるという状況への解決策として、テラデータは独自技術のソフトウェア「Teradata Virtual Storage(TVS)」を開発して、Active EDW 6680に搭載している。TVSは、同社のDWH専用データベース「Teradataデータベース」の一機能であり、ストレージの集合を仮想化して、単一のプールと見なすことで、さまざまな種類のストレージを混在させることができる。

 一般的に「60%のアクセスは25%のデータに集中する」(丹氏)と言われており、TVSを活用すれば、この頻繁にアクセスされるホットデータはI/O速度が速いSSDに、ほとんどアクセスされないコールドデータは大容量のHDDへ格納するといったことができる。TVSは、データがロードされた時点で初期温度を設定し、データの特性に応じた自動配置も可能としている。時間とともに変化するデータ温度を監視して、最適なストレージに自動的に再配置するということも可能としている。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]