Googleは米国時間5月6日、同社の主要サービスのほとんどで使われている「Cloud Bigtable」テクノロジを、フルマネージド型クラウドNoSQLデータベースサービスとして公開した。
検索とクラウドの大手である同社が2006年の重要な論文で発表したBigtableは、「Gmail」や「Google Analytics」「Google Search」といったアプリケーションに利用されている。同社はこのBigtableについて、大規模なデータ採集やアナリティクス、大量のデータを扱うワークロードを目的としたものだとしている。
これまで、Bigtableは明確には一般公開されてこなかった。ただし、GoogleのスキーマレスなNoSQLのストレージサービスである「Cloud Datastore」は、このテクノロジを基盤としている。
GoogleのCloud Bigtableは現在、ベータ版として公開されており、オープンソースデータベースの「Apache HBase」のAPIを経由して提供されているため、Googleによれば、既存のビッグデータの多くや、Hadoopのエコシステムなどとネイティブに統合できるという。
Cloud Bigtableは、メッセージングツールの「Cloud Pub/Sub」や、パイプライン開発ツールの「Cloud Dataflow」、アナリティクスソフトウェアの「BigQuery」といった、Googleのほかのビッグデータ製品と統合されている。
Cloud Bigtableの製品マネージャー、Cory O'Connor氏
提供:Google
Cloud Bigtableの製品マネージャーのCory O'Connor氏は、「レイテンシは10ミリ秒未満で、ほかの製品に比べて非常に低く、コストパフォーマンスが優れている。つまり、1カ月1ドルで、取り込みと保存、さらに書き出しができるデータの量が、極めて多いということだ」と述べている。
Googleによると、この新しいサービスは競合製品と比べて、コストパフォーマンスは2倍、総所有コストは半分で済むという。
「大量のデータを保有している企業は非常に多いが、そうした企業の多くに話を聞いたところ、現在はある程度の期間が経過したらデータを捨ててしまっているか、無効にしているということだった。時間的な視点が全くないのだ。また、そうした決定ができるほど十分なデータを保存できていない」(O'Connor氏)
「こうした問題に対処するテクノロジが全て、1つの製品に一括して搭載され、管理の必要がなくなる。それだけのデータサイズに対応できるテクノロジを1つ持っていたとしても、管理の問題が常にあった」(同氏)
Cloud Bigtableでの作成や設定変更はシンプルなユーザーインターフェースを通して行われ、補助ストレージは自動的にスケーリングされる。
「われわれの言うフルマネージドとは、完全なデプロイのことでも、管理されたデプロイのことでもない。基本的に、サーバプロセッサのスループットが確保され、さらにそのために無制限かつ柔軟なストレージも同様に確保されているプロビジョニングができるAPIだ」(同氏)
「現在は、まず自分が必要とするデータベースについてリサーチし、そのデータベースのライセンスを取得し、そのデータベース向けのサポート契約を結び、どの仮想マシンを使うか検討し、仮想マシンのサイズを試算し、メモリを選ぶという作業をしなければならない。そのために非常に多くの選択を行わなければならず、多くのリサーチが必要になる」(同氏)
O'Connor氏によれば、従来の構成ではストレージやネットワーク、バックアップ、仮想マシンについて考えなければならないため、デプロイを考慮しなくても複雑な作業になるという。
「これには、仮想マシンを起動し、ソフトウェアをデプロイし、全てのノードを設定するという山のような作業が必要になる。Bigtableでは文字通り、ウェブサイトをぱっと開いて、ユーザーインターフェースを使って『新しいクラスタを作成する』ということになる」(同氏)
「ユーザー名と、基本的にそのクラスタで必要とするパフォーマンスを聞かれる。作成ボタンをクリックすると、数秒以内にユーザーインターフェースに緑の小さなチェックボックスが表示される。そうすると、1秒当たり10万回の読み取りと書き込みができ、必要に応じてすぐにデータを拡張できるクラスタが作成されている。GoogleはBigtableを10年間管理してきた。われわれはそれをうまく扱う方法について非常に良く理解している」(同氏)
O'Connor氏は、企業がこの新しいサービスを使って、例えばオンプレミスやクラウド上のHBaseや「Cassandra」のクラスタから移行することができるとしている。