Tibero 6.0を開発するTIBEROが、このボトルネック解決策として選んだのがHDDとSSD、メモリの併用策だ。朴氏はインメモリDBについて「高速だが、低コストで大容量のデータを保存できる(HDDとSSDを含む)ディスク領域を効率的に活用できない」と指摘。つまり、インメモリDBはコスト効率が良くないことを示している。
全てのデータをメモリに載せるのは確かに均一な性能をもたらすが、ユーザー企業が抱えるデータ容量次第ではコストがかかりすぎる場合がある。それよりは、より低コストなディスクを活用した方がコスト効率を高めることができるからだ。
先に挙げたようにTibero 6.0は、基幹系システムでのトランザクション処理をするとともに、分析対象となるデータの保存場所となることも想定している。いわば、データウェアハウス(DWH)としての役目も担っている。DWHも含めたRDBMSで良くいわれるのが、“ホットデータ”と“コールドデータ”の存在だ。
ホットデータは、例えば、業務で発生して入力されてから1週間で照会や更新が頻繁にされるデータ、つまりアクセス頻度が高いデータだ。それに対するコールドデータは、入力されてから数カ月や1年などが経過したデータ、アクセス頻度が低いデータを指している。
Tibero 6.0は、データが使用されるパターンを分析して、ホットデータとコールドデータを最適な位置に自動で配置する“Automatic Data Re-location”という機能を搭載している。この技術によって、アクセス頻度の高いデータはメモリに、ほとんどアクセスされないデータはHDDに、その中間のデータはSSDに格納されることになる。
イベントでTibero 6.0を説明する、TIBERO DB研究所 主席研究員 李容在氏
イベントでは、TIBEROのDB研究所で主席研究員を務める李容在(イ・ヨンジェ)氏がTibero 6.0を紹介した。李氏はインメモリDBの限界として“ガベージコレクション”の存在を指摘した。ガベージコレクションは、動的に確保されたメモリ領域のうち、不要になった領域を自動的に解放する機能だ。李氏によれば、インメモリDBは、このガベージコレクションが必要になる。これが、ディスクとメモリを併用するTibero 6.0では、ガベージコレクションが不要になると、そのメリットを説明している。
この数年RDBMSの分野で注目されているのが、オンライントランザクション処理(OLTP)とOLAPという異なる処理を同一システムの中でできないかという動きだ。その解決策として注目されているのが、インメモリDBであり、RDBSを中心にソフトウェアとハードウェアを作り込んで最適化したデータベース専用機(アプライアンス)だ。
ZDNet Japanの取材に対して、先の孔氏は、Tibero 6.0について「OLTPからOLAPへのアプローチを進めたもの」と表現した。「OLTPとOLAPという異なる処理を共通して使えるように部品を単純化していこうとしている」(孔氏)
至るところにデータがあり、それを分析すれば、企業にとって有益な情報を価値を獲得できる――。極論すれば、ビッグデータが注目を集めるのは、そうした可能性があるからだ。そうした流れの中では、構造化と非構造化という異なる種類のデータを総合的に分析することが必要とされている。加えて、構造化データの領域では、OLTPとOLAPを同一システムで処理することに注目が集まっている。
Tmaxが開発するInfiniData 3.0とTibero 6.0は、そうした流れへの一つの回答であり、考慮に値する解決策かもしれない。InfiniData 3.0は来春、Tibero 6.0は2014年上半期に、日本法人の日本ティーマックスソフトから日本市場に提供される予定となっている。