Prestoは新技術であり、日本ではあまり注目されていないが、すでに米国ではAirbnbやUber、Dropbox、そしてAppleなどのシリコンバレーから誕生した先進企業が採用している。イノベーションのスピードという観点から考えても、(すでに存在している)OSSの技術を取り入れ、発展させていくことが良い製品を提供できる方法だと考えている。
――ヤフーとの技術提携で具体的には何をするのか。
われわれはR&D(研究開発)のリソースを提供していく。ヤフーは高度な分析に関して、多くのアイデアを持っている。彼らのアイデアとTeradataのインフラを組み合わせて“知的財産”を作ると考えてほしい。

Brobst氏は基調講演で分析エコシステムの重要性を強調した
レイク(沼)ではなくレザボア(貯水池)
――Teradata Universe Tokyo 2016の基調講演では、データキュレーションについて言及した。かねてから「データレイク」「ビッグデータ」という言葉に対して否定的だが、自身が考えるデータキュレーションのあり方とはどのようなものか。
今回の基調講演でも(日本法人社長の)吉川(幸彦)サンには「ビッグデータという言葉は使わないようにするべきだ」と話した(笑)。生成されるデータ量が膨大(ビッグ)なのは当たり前のことであり、あえて言う必要はない。

もはやトレードマークになっているアロハシャツで基調講演に登壇。従来的なメタデータの管理では、「データが複雑化し、“汚い”データになる」と指摘した
私は「データレイク(沼)」でなく、「データレザボア(貯水池)」という言葉を使い続けている。データは効率的に利用しなければ役に立たず、そのためにはデータ資産の管理が必要になる。
“沼”に溜まった(活用性のない)データは使いたくない。2015年、Gartnerが明かにした予測では、現在企業で導入されているデータレイクの90%が2018年には役に立たないものになっているという。
データを生かすためには、正しいデータキュレーションが不可欠だ。そのための技術は数多く存在するが、ソーシャルコラボレーションやクラウドソーシングといった手段を使うことも有効だと考えている。
例えるなら、古いメタデータは百科事典、新しいメタデータはWikipediaだ。現在、調べ物をするのに百科事典を開く人がどのくらいいるのか。データの鮮度や内容を考えても、Wikipediaを利用する人が圧倒的だろう。Teradataはデータキュレーション製品をリリースしていないが、われわれはこうした製品とインテグレーションするためのインタフェースを提供している。
TechRepublic Japan関連記事:ハイブリッドクラウド座談会
(1)企業ITの行き先を徹底討論する
(2)エンタープライズ×AWSをさまざまな視点で議論
(3)SDNやDockerは何を変えるのか
(4)アーキテクチャを理解しておく必要がある
(5)IT部門に求められるスキルが変化している
――クラウド戦略について教えてほしい。2015年10月にAmazon Web Services(AWS)上で稼働する「Teradata Database on AWS」を発表した。また今回、新たに複数のセルフサービス機能を追加した。2016年のグローバル戦略のもう1つの柱として、「多様で柔軟な実装形態での製品提供」を掲げている。今後はパブリッククラウドでの提供に注力していくのか。
2015年10月より以前にTeradata Database on AWSはプロトタイプとして稼働していた。その時点で製品化しなかった理由は、AWSのパフォーマンスの信頼性が高くなかったからだ。以前のAWSは、パフォーマンスにばらつきがあった。並列処理の場合、パフォーマンスの遅い方に合わせるために、AWS上ではTeradata Databaseが十分にパフォーマンスを発揮できないという課題があった。
しかし、AWSはオプションでの提供ではあるが、(以前と比較して)ハイパフォーマンスカテゴリのサービスをリリースし、パフォーマンスのばらつきを減らしている。この段階で、Teradata Databaseの利用で問題ないプラットフォームだと判断し、サービス開始に踏み切った。
パブリッククラウドで言えば、Microsoft Azureでも稼働させられる。具体的な提供開始日は決まっていないが、すでに準備は整っている。技術的な観点から言えば、パブリッククラウドでTeradata製品を稼働させることは難しくない。