Amazonの子会社Amazon Web Services(AWS)は米国時間4月2日、オープンソースのソフトウェアフレームワーク「Hadoop」を利用して大量のデータ解析を行う、新たなクラウドコンピューティングのベータサービスを開始した。
「Amazon Elastic MapReduce」と呼ばれるこのサービスは、集中的なデータ処理を必要とする企業、研究者、アナリストを対象に開発された(発表資料)。HadoopはYahooなどの企業も採用しているが、Clouderaなどの新興企業はHadoopを企業データセンターとして利用するためのサービスを提供している。
Amazon Elastic MapReduceは、同社の「Elastic Compute Cloud」(EC2)および「Simple Storage Service」(S3)上でHadoopを稼働させる。顧客はAmazon Elastic MapReduceを使って、ウェブのインデックス化、データマイニング、行動ファイナンス分析、シミュレーション、バイオインフォマティクスなどの処理を行い、利用したサービスの分だけ課金される。
声明でAmazonは次のように記している。
Amazon Elastic MapReduceは、ウェブ規模のインフラであるAmazon EC2上のHadoopソフトウェアによって実行されるデータ処理のジョブフローを作成する。このサービスは、顧客が数と種類を指定したAmazon EC2インスタンスを自動的に開始し設定する。続いて、MapReduceプログラミングモデルを実装したHadoopが実行され、Amazon S3からユーザーの入力データを大量に読み込み、細分化したデータをAmazon EC2インスタンスを使って並列処理する。処理が完了するとデータは再び結合され、最終的な回答にまとめられて、結果はAmazon S3に再び保存される。ユーザーはウェブサービスAPIもしくは「AWS Management Console」を通じて、ジョブフローを設定、操作、監視できる。
大まかに言えば、データマイニングをわれわれのところでやろう、ということだ。
MapReduceは別途サービスとなり、米国での価格は以下のようになっている。
この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ