Facebookのような巨大なものもありますが、ほとんどの場合、1テラバイトというのは非常に大きなトランザクション処理データベースです。そして今では、1テラバイトのメモリが2万5000ドルくらいで買えるようになっています。わたしの意見では、トランザクション処理市場は、ディスクベースのロウストアから、従来とはまったく異なるトランザクション処理の実装を伴う、メインメモリシステムに変化しつつあります。
「SAP HANA」はその一例ですし、「Hekaton」(Microsoftによる「SQL Server」のインメモリOLTP実装)もそうですし、わたしが立ち上げた会社であるVoltDBもその例です。わたしは、市場はメインメモリソリューションへと移行する過程にあると考えています。ここでも、従来のベンダーは、この技術的な流れの反対側にいます。
「そのほかすべて」の市場は、4つに分かれています。まずNoSQLのグループがあります。ここには100前後のベンダーがいて、幅広いさまざまなデータモデルと、幅広いさまざまな機能を提供しています。
MongoやRedixが有名ですが、ほかにも数多くのベンダーが存在します。これらは、リレーショナルデータベースシステムには似ていません。
2つめのグループは、機械学習、データクラスタリング、特異値分解などの複雑な分析をしたい人たちです。こういったものは、すべて配列で定義されており、テーブルは使われません。
こういった複雑な分析は、将来はもっと一般的になるでしょうが、これは配列ベースになります。従って、テーブルの上に配列をシミュレートしてこれをシミュレートするか、配列ベースのエンジンを使うことになるでしょう。
どうなるかはまだ分かりませんが、この市場ではリレーショナルデータベースシステムに有利な点はありません。
3つ目のグループはグラフ処理であり、例えばFacebookのようなソーシャルネットワークは巨大なグラフです。わたしからあなたへの平均距離を知りたければ、これはグラフの計算になります。ここでも、テーブルベースのシステムには明白な利点はなく、この市場が成長するにつれて状況が見えてくるでしょう。
それから、Hadoop市場があります。
わたしが見るところでは、この市場の3分の2については、従来のベンダーには技術的に間違った側にいます。そして残り3分の1でも、明白な利点があるわけではありません。
2005年に書いた論文では「1つのサイズですべてをまかなう時代はもう終わった」と述べたのですが、2015年のわたしは、もっと突っ込んだ形で「1つのサイズでまかなえるものはない」と言っています。Oracle、IBM、Microsoftの従来の実装が適しているものは、基本的に何もありません。
--それはかなり突っ込んだ発言ですね。
わたしの分類を信じてもらえるなら、データベース市場は全体の3分の1の大きさの市場が2つと、12分の1の市場が4つに分かれます。そしてその中に、大手リレーショナルデータベースベンダーの現在の実装が特に有利になる市場は1つもありません。わたしはそれらのベンダーを親しみを込めて「象」と呼んでいます。
別の言い方をすれば、どの市場でも、それらの従来の実装よりもよいものがあるということです。