機械学習は、ビッグデータが起こすイノベーションの次のフロンティアだ。そして、クラウドはそのフロンティアの中の次のフロンティアだと言える。
5年近く前、Googleはクラウドベースの機械学習サービスである「Prediction API」をリリースした。また、Microsoftは2014年7月に「Azure Machine Learning」(Azure ML)サービスをプレビューとしてリリースし、2015年2月に一般提供を開始している。このサービスはオープンソースのR言語で書かれたコードと驚くほど親和性が高い。
これらは序盤の動きとしては興味深かったが、Microsoftが2015年1月にRevolution Analyticsを買収する計画を発表したことで、同社の構想は厚みを増した。Revolution Analyticsは、オープンソースのRプロジェクトに営利組織としてもっとも貢献しており、Hadoopと特に相性のよい強力な分散コンピューティング版のR言語(「Revolution R」)を開発している。
だが、本格的な戦いが始まったのは4月第1週だ。米国時間4月6日、MicrosoftはRevolution Analyticsの買収が完了したと発表した。そして9日には、Amazonがとうとう、クラウド機械学習サービス「Amazon Machine Learning」(Amazon ML)を発表した。 これで、大手クラウドプロバイダー3社によるレースが始まったことになる。
3つの優れたサービス
では、どれを選ぶべきだろうか。どれもすべて、優れたサービスだ。まだ予測分析を利用していないのであれば、どれを使っても非常に有用だろうし、まだ使っていない企業の方が多いだろう。
この3つのクラウドプロバイダーはすべて、提供している機械学習サービスは、社内で使用していたテクノロジをベースにしていると述べている。言うまでもなくAmazonは、設立当初から電子商取引事業で予測分析を利用していた。Googleは、同社の核である検索サービスで予測的なロジックを使用している。Microsoftも、「Bing」や「Xbox」、その他のサービスで同じように予測分析を使用している。
機械学習サービスで利用できるデータ源として、3社とも自社のストレージサービスおよび1つまたはそれ以上のデータベース製品を連携させている。
- Amazon Machine Learningは、「S3」「Redshift」および「Amazon Relational Database Service」(RDS)のMySQL版と連携する。
- Google Prediction APIは、「Google Cloud Storage」と「BigQuery」からデータを読み込むことができる。
- Microsoftは同社のストレージサービスである「テーブル」および「Blob」の両方に加え、「SQL Database」「Hadoop」の「Hive」テーブル、有効なURLで指定された「OData」フィードおよびフラットファイルをサポートしている。
ウェブサービス呼び出しによる利用
3つのプロバイダーはすべて、一連の予測モデルをサポートしている。また3社とも、入力変数の値を送信し、目的変数の予測値を受け取るためのAPIを提供している。予測分析をすべてクラウドで扱う利点は、どのクライアントアプリケーションからでも、ウェブサービス呼び出し1つで予測を実行できることだ。