本特集「ビッグデータとは何か」の第6回となる今回は、データウェアハウス分野のトップ企業であるTeradataの「ビッグデータ」戦略をテーマにしよう。
筆者は現在、たまたま同社ユーザー会の年次イベント「Teradata PARTNERS Conference」(サンディエゴにて開催)に参加しているので、そこで得られた最新情報やマネージメントインタビューの内容も含めて分析していきたい。
構造化データ分析ではリーダーのポジション
広い意味における「ビッグデータ」の一部を構成する構造化データの分析という点では、Teradataは比類のないリーダーだ。同社の顧客でデータウェアハウスのデータ量が1ペタバイトを越えた企業(通称、ペタバイトクラブ)は20社に及ぶ。
その内で最大のものはオークションサイトのeBayであり、そのデータ量は84ペタバイトに達する(これは筆者の知る限り商用のデータウェアハウスでは最大規模だ)。理論値や架空のアプリケーションに限定した性能ベンチマーク値ではなく、現実の企業が日々ビジネスに活用するデータウェアハウスで、これだけのデータ量を扱えているのは驚異的という他はない(なお、これだけのデータ量を問題なく稼働できるTeradata RDBMSのテクノロジも驚異だが、自社のデータ資産にこれだけ思い切った投資を行なう米国企業のIT戦略も驚異と言えよう)。
もうひとつの注目すべきポイントは、eBayというネット企業の代表格がTeradataを活用している点である。これ以外にもLinkedIn、Travelocity、そして噂レベルではAmazonもTeradataを使用しているようだ。特に、AmazonやLinkedInは独力でNoSQLの基盤を構築できるだけの技術力を持った企業である点には注目だ。このような企業ですらTeradataを必要とするということは、超大規模並列DBMSがまだコモディティ化された領域ではないという現実と同時に、NoSQLとRDBMSは相互補完的であるという本特集の第3回の主張を裏付けてもいるだろう。
Teradataの顧客としては世界最大の小売業であるWal-Mart Storesが有名だが、同社などの流通業、そして金融や通信といった伝統的に強い業界に加えて、ネット企業のデータウェアハウスにおいてもTeradataは確固たる地位を築いている。「ビッグデータ」の中心であるネット企業での地位を固めているということは、同社も「ビッグデータ」戦略を強めなければいけないことを意味する。実際、今回のPARTNERS Conferenceにおいても、Hadoopや「ビッグデータ」関連のセッションが数多く行なわれ、多くの受講者を集めていた。
その一方でHadoopのセッションの受講者においても、実際にHadoopのプロジェクトを実行している人は全体の数パーセントに過ぎず、米国企業においてもHadoopが一般的になったとはまだとても言えない状態であることを認識させられた。