GoogleがGoogle Cloud Platformを利用した新しいクラウドサービス「Cloud Dataproc」のベータ版を発表した。「Apache Hadoop」および「Apache Spark」を利用したデータ分析を簡素化するという。
Cloud Dataprocはデータクラスタ管理を自動化したいというオープンソース開発者向けのサービスとなる。
Google Cloud PlatformのプロダクトマネージャーJames Malone氏は、このサービスを発表したブログ記事で、「Cloud Dataproc自動化によりクラスタを迅速に作成し、容易に管理することができる。不要なときにクラスタをオフにできるため、コストを削減できる」とし、「管理に費やす時間とコストを削減し、自分の仕事とデータにフォーカスできる」と記している。
同様のサービスはAmazon Web Services(AWS)、Microsoft Azureなどでも提供されており、Cloud DataprocによりGoogleは競合他社に追いつくにすぎない。Googleは、価格で競争力を維持しようとしている。
Googleによると、企業は特別なソフトウェアや管理者の支援なしにSparkとHadoopクラスタを利用できるという。利用者は「Google Developers Console」「Google Cloud SDK」「Cloud Dataproc REST API」を利用して、クラスタとやりとりしてSparkやHadoopジョブを実行できる。使われていないクラスタをオフにすることで、不要なコストの発生を防ぐことができるという。
Cloud Dataprocは「BigQuery」「Cloud Storage」「Cloud Bigtable」「Cloud Logging」「Cloud Monitoring」などのGoogleのクラウドサービスに統合されており、ベータ版ではSparkはバージョン1.5、Hadoopは2.7.1をサポートする。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。