テラデータのDWH新ハイエンドモデルに見るI/Oボトルネック解決策

田中好伸 (編集部) 2011年05月20日 15時55分

  • このエントリーをはてなブックマークに追加

 日本テラデータは5月17日、データウェアハウス(DWH)製品の最上位機種「Teradata Active Enterprise Data Warehouse(Active EDW)」の最新モデル「Teradata Active Enterprise Data Warehouse 6680」と「Teradata Active Enterprise Data Warehouse 6650」の販売と出荷を開始した。価格は最小構成でActive EDW 6680が1億7000万円から、Active EDW 6650が1億円からとしている。

 Active EDW 6680は、ソリッドステートドライブ(SSD)とハードディスクドライブ(HDD)のハイブリッド型ストレージを標準で搭載したハイパフォーマンスモデル。SSDとHDDを組み合わせて格納できるデータ容量は4テラバイト~36ペタバイト。一方のActive EDW 6650はストレージはHDDだけだが、将来的にSSDとのハイブリッド型ストレージにアップグレードすることができる。格納できるデータ容量は4テラバイト~92ペタバイトだ。

 Active EDWシリーズのこれまでのハイエンドモデルであるActive EDW 5650とActive EDW 6680を比較すると、設置面積と消費電力を最大75%削減でき、単位データあたりのパフォーマンスは4倍に向上しているという。Active EDW 5650とActive EDW 6650を比較すると、設置面積と消費電力を最大25%削減できると、そのメリットを強調している。

 日本テラデータの丹隆之氏(マーケティング統括部プロダクト・マーケティング&マネジメント部部長)は、Active EDW 6650のもう一つのメリットとして「旧世代システムとの“共存”で継続的に投資を保護できる」ことを挙げている。この共存とは、異なる世代のノードを同じシステム内で結合するテラデータ独自の機能であり、Active EDW 6650と1世代前のActive EDW 5650や2世代前のActive EDW 5600などを高速相互接続技術である「BYNET」で結び、システムを拡張できる。Active EDW 6650はシステム内に6世代までの共存をサポートしている。

HDDがシステムのボトルネック

 2006年ごろからマルチコアCPUが本格的に活用されるようになっているが、その一方で「HDDのパフォーマンス向上が見られない」(丹氏)。そこで課題となっているのが「CPUパワーにディスクのパフォーマンスが追いついていけなくなってしまっている」(丹氏)ことだ。HDDがシステムのI/Oのボトルネックになっているという状況である。企業システム一般に言えることだが、データ処理性能が特に重要視されるデータウェアハウスでは特に大きな課題となる。テラデータではSSDを搭載することで、この課題を解決しようとしている。

 「それではいっそのこと、ストレージのすべてをSSDにしてしまえばいい」となるところだが、米Teradataの最高技術責任者(CTO)であるStephen Brobst氏は、すべてをSSDにすることには「不経済」として否定的だ。「データに“種類”があることを想定していない」(Brobst氏)からだ。

 ここで言うデータの種類とは、ホットとウォーム、コールドという3つだ。ホットデータは頻繁にアクセスされるデータであり、コールドデータがほとんどアクセスされないデータであり、ウォームデータがその中間に位置付けられる。つまり、データの“温度”にあわせて蓄えるストレージも使い分けられるべきというのがテラデータの回答だ。 「他社ではSSDをキャッシュとして活用している。これはオンライントランザクション処理(OLTP)にはいいのだが、DWHに向いていない」(Brobst氏)

 テラデータでは、データ温度の分布を測定するツールである「IOCNT」を提供している。これは、どのディスク領域がどれだけの回数アクセスされているかを測定するものであり、一定期間データ温度の分布を測定することで、適切なストレージ構成の計画を支援できると説明している。ホット、ウォーム、コールドはそれぞれどれくらいのパーセンテージなのかが分かり、ホットデータのためにどれだけのSSD領域が必要かを明らかにすることができる。Active EDW 6680について、データ温度の割合に応じて最適なハイブリッドの構成をサポートしており、データの領域と温度に対するニーズを満たすために4つの構成を提案している。

 データに温度があるという状況への解決策として、テラデータは独自技術のソフトウェア「Teradata Virtual Storage(TVS)」を開発して、Active EDW 6680に搭載している。TVSは、同社のDWH専用データベース「Teradataデータベース」の一機能であり、ストレージの集合を仮想化して、単一のプールと見なすことで、さまざまな種類のストレージを混在させることができる。

 一般的に「60%のアクセスは25%のデータに集中する」(丹氏)と言われており、TVSを活用すれば、この頻繁にアクセスされるホットデータはI/O速度が速いSSDに、ほとんどアクセスされないコールドデータは大容量のHDDへ格納するといったことができる。TVSは、データがロードされた時点で初期温度を設定し、データの特性に応じた自動配置も可能としている。時間とともに変化するデータ温度を監視して、最適なストレージに自動的に再配置するということも可能としている。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

関連ホワイトペーパー

連載

CIO
IT部門の苦悩
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
「企業セキュリティの歩き方」
「サイバーセキュリティ未来考」
「ネットワークセキュリティの要諦」
「セキュリティの論点」
スペシャル
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
AWS Summit
PTC LiveWorx
より賢く活用するためのOSS最新動向
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
米株式動向
日本株展望
企業決算