アマゾン、「Hadoop」を利用した「Amazon Elastic MapReduce」のベータサービスを開始

文：Larry Dignan（CNET News.com）翻訳校正：中村智恵子、福岡洋一

2009-04-03 11:09

　Amazonの子会社Amazon Web Services（AWS）は米国時間4月2日、オープンソースのソフトウェアフレームワーク「Hadoop」を利用して大量のデータ解析を行う、新たなクラウドコンピューティングのベータサービスを開始した。

　「Amazon Elastic MapReduce」と呼ばれるこのサービスは、集中的なデータ処理を必要とする企業、研究者、アナリストを対象に開発された（発表資料）。HadoopはYahooなどの企業も採用しているが、Clouderaなどの新興企業はHadoopを企業データセンターとして利用するためのサービスを提供している。

　Amazon Elastic MapReduceは、同社の「Elastic Compute Cloud」（EC2）および「Simple Storage Service」（S3）上でHadoopを稼働させる。顧客はAmazon Elastic MapReduceを使って、ウェブのインデックス化、データマイニング、行動ファイナンス分析、シミュレーション、バイオインフォマティクスなどの処理を行い、利用したサービスの分だけ課金される。

　声明でAmazonは次のように記している。

　Amazon Elastic MapReduceは、ウェブ規模のインフラであるAmazon EC2上のHadoopソフトウェアによって実行されるデータ処理のジョブフローを作成する。このサービスは、顧客が数と種類を指定したAmazon EC2インスタンスを自動的に開始し設定する。続いて、MapReduceプログラミングモデルを実装したHadoopが実行され、Amazon S3からユーザーの入力データを大量に読み込み、細分化したデータをAmazon EC2インスタンスを使って並列処理する。処理が完了するとデータは再び結合され、最終的な回答にまとめられて、結果はAmazon S3に再び保存される。ユーザーはウェブサービスAPIもしくは「AWS Management Console」を通じて、ジョブフローを設定、操作、監視できる。

　大まかに言えば、データマイニングをわれわれのところでやろう、ということだ。

　MapReduceは別途サービスとなり、米国での価格は以下のようになっている。