Googleは米国時間2月22日、「Google Cloud Dataproc」の一般提供を開始したと発表した。
Cloud Dataprocは、「Google Cloud Platform」上における、「Apache Hadoop」および「Apache Spark」のマネージドサービスだ。このサービスは、自らのデータクラスタの管理を自動化したいと考えているオープンソースユーザーに向けたものとなっている。
Googleによると、Cloud Dataprocのベータ版提供を開始した2015年9月以降、HadoopおよびSpark上でのデータ分析を簡単に実施できるようにするための複数の機能を同サービスに追加してきたという。
GoogleのプロダクトマネージャーJames Malone氏は、「Cloud Dataprocのベータテスト期間中に、プロパティのチューニングや、仮想マシン(VM)のメタデータとタギング、クラスタのバージョニングといった複数の重要な機能を追加した」とブログに記している。
同様のサービスが「Amazon Web Services」(AWS)や「Microsoft Azure」といった他のクラウドプラットフォーム上で既に利用可能となっている点を考えると、Googleのこのサービスは本質的に他社に追随したものと言える。しかし、同社は価格面で勝負に出ようとしている。
Cloud Dataprocの価格は、クラスタ内の仮想CPUごとに1時間当たり1セントとなっている。また、クラスタ内にはより低価格で提供されているプリエンプティブルインスタンスを含めることができるため、さらにコストを引き下げることも可能だ。さらに、多くのサービスプロバイダーでは使用量を1時間単位に丸めるようになっているが、Cloud Dataprocは最低10分間の使用という条件の下、1分単位の課金体系となっている。
Googleによると、企業は管理者や特別なソフトウェアを用意することなく、SparkやHadoopのクラスタを使用できるという。また、ユーザーは「Google Developers Console」や「Google Cloud SDK」「Cloud Dataproc REST API」を使って、クラスタおよび、SparkやHadoopのジョブとやり取りできるうえ、クラスタが使用されなくなった場合には、不必要な出費を避けるために停止することもできるという。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。