こうしたモデルは、様々なタイプの予測を行うのに使うことができる。二項分類は、「この電子メールはスパムかどうか」といった形の、2つの起こりうる結果から1つを予測するために使われる。多クラス分類は、3つ以上の起こりうる結果から1つを予測したり、それぞれの可能性を予測したりするのに使われる。例えば「この製品は、衣類に関する本、映画、記事のうちのどれか」といった予測だ。回帰は、「明日の予想気温は何度か」といった、数の予測に使われる。
このサービスは、データを自動的に検証し、可能な場合には、それをさらに有益な形に変換することも試みる。例えば、住所からの郵便番号の抽出などがそうだ。
いったんこのモデルを構築してしまえば、開発者はそれにAWSコンソールかAPI呼び出しを経由してアクセスでき、予測をアプリやオンラインサービスに送ることが可能になる。モデルは、コンソールのスライダーを使って微調整できる。
「開発者は、機械学習をほとんど知らなくてもいい。機械学習の細かな操作はサービスが行う」(Wood氏)
このようなクラウドベースのサービスによって、機械学習を試してみることのハードルが下がり、最初にスキルを身につけるのに必要な時間と費用も抑えられると、同氏は言う。
Amazonは、このサービスによって、開発者が機械学習を始めることがどのくらい容易になったのか検証している。具体的には、機械学習の予備知識のない2人の開発者に、人の名前から性別を予測するモデルを構築する作業を課した。
この開発者らがモデルを構築するのに1カ月かかった。このモデルは国勢調査のデータを使ってトレーニングした結果、92%の精度で予測できた。対照的に、Amazonのサービスを使って、機械学習の知識のない開発者が1人で同じモデル(予測精度も同じ)を構築するのにかかった時間は20分だった。
とはいえ、こうしたクラウドサービスが、あらゆる人の機械学習のニーズに合っていると言っているわけではない。
その理由の1つは、そうしたサービスはスタート時の費用を節約するかもしれないが、長期的に使うと高額になる場合があることだ。Amazonのサービスは、100万件の予測を行うのに100ドル程度かかることがある。
ある起業家が言っているとおり、「これは、自分のスタートアップで使うのには本当に良さそうだが、どれだけ予算があっても高額すぎて手が出せない」のである。
このサービスは、ユーザーを囲い込んでいるという批判も受けている。同サービスは、ユーザーにモデルのエクスポートやインポートを許可していないからだ。
開発者フォーラム「Hacker News」で、あるユーザーは、「多少でも分別のある企業なら、自分の予測モデルをAWSに閉じ込めておこうとは思わないはずだ」と言っている。
まだスタートして間もない同サービスにはこうした批判があるものの、Wood氏は、同サービスが、以前はどこから手をつけてよいか分からなかったような企業に対し、機械学習を試してみる機会を増やしていると考えている。
「私が重要だと考えるのは、生産性と、開発者がこうしたものにアクセスできるようにしておくことだ」(同氏)
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。