商用リレーショナルデータベース(RDB)が登場して30年近くになるが、RDBは紆余曲折を繰り返しながら発展し、今や基幹システムにも使用されるまでに成長した。すでになくなってしまったRDBベンダーも多い中、Teradataが現在でも成長を続けることができる理由やRDB市場の変遷について、NCR Teradata事業部の最高技術責任者(CTO)であるStephen Brobst氏に話を聞いた。
--リレーショナルデータベース(RDB)が登場して30年近くになります。まずはRDBが登場した背景についてきかせてもらえますか。
Teradataの歴史は、RDBの歴史と同じと言っても過言ではありません。なぜ、RDBが生まれたかをお話しすると、まず標準の言語で読み書きできるデータベースが必要だと考えたからです。それが、RDBであり、SQL言語でした。
データベースがネットワーク構造からテーブル構造に変化したのは、テーブル構造の方がより使いやすいからです。実際に何を聞かなければよいか分からない場合でも、さまざまな切り口でデータを柔軟に検索することが可能です。
また、ビジネス指向であるということも重要です。RDBでは、ポインタ(アドレス)などを意識する必要もなく、よりビジネスに近い言葉でデータをアクセスすることが可能です。
--この30年間、RDB市場の変遷をどのように見てきましたか。
ここ数年、RDBはテラバイトからペタバイトにまで拡張できるようになりました。これには、いくつかの要因が挙げられます。
Teradataを例にお話しすると、まず大規模なRDB環境や複雑化するストレージ環境の管理を自動化できる仕組みを実現しています。これにより、ペタバイトクラスのRDBでも容易に管理することができるようになりました。
また、SQL言語のパワーが飛躍的に向上しています。以前であれば、RDBから必要なデータを抽出し、クリーニングしてDWHを作成することで、はじめてデータマイニングが可能でしたが、現在ではRDBの中でリアルタイムにデータマイニングを行うことが可能になっています。
さらにRDBの中で、構造化されたデータだけでなく、非構造化データや地理情報システム(GIS)、無線ICタグ(RFID)など、さまざまなデータを統合して管理できる機能も提供されています。
--RDBにおいてテクノロジの問題はなくなるという話をされていますが、今後解決すべき問題とは?
技術的な面では、Teradataはシェアドナッシングの仕組みを取り入れていますので、キャパシティの問題は全く考える必要がなくなりました。シェアードナッシングは、検索プロセスに対し、データが論理的に分散されている構造のことです。検索プロセスごとにデータが割り当てられているので、並列度を増してもデータアクセスの競合は発生せず、リニアに処理性能を向上させることができます。
また、ストレージのディスク密度も今後さらに向上していくので、より効率的にデータを蓄積し、管理できるようになるでしょう。
現在、最も注目されているのがセキュリティ面ですが、PAPA(Privacy、Accuracy、Property、Accessibility:プライバシー、正確性、資産、アクセス性)の実現は難しい問題です。今後、データの暗号化は重要な技術のひとつになります。
データの信頼性や質をより一層向上させることを目的に、Teradataではデータアクセスの解析機能を強化しています。セキュリティの問題を越え、さらに顧客のプライバシーも守っていくことが必要です。その上で、個々のユーザーが必要な情報を容易に活用できる仕組みを実現しなければなりません。
Teradataではそのほかにも、ガバナンスやポリシーを策定するコンサルティングサービスも提供しており、社会のためになる情報管理の実現を目指した取り組みを展開しています。
--蓄積したデータの中から本当に必要なデータを見つけ出し、情報に変化させるための仕組みも必要ですね。
確かに、ビジネスにおいてどの情報が本当に必要であるかを前もって知ることはなかなか困難なことです。ビジネスにおいては、その状況に直面して初めて必要なデータが何であるかを知ることができるからです。
そこで、どんな状況においても必要なデータに迅速かつ柔軟にアクセスできる環境を提供することが必要です。このとき、低コスト、高パフォーマンスでデータにアクセスできることも重要になります。