新日鉄住金ソリューションズ(NSSOL)は7月11日、機械学習を用いた予測モデルの作成を自動化するソフト「DataRobot」について製品説明会を開催した。登壇した米DataRobot日本支社ディレクターの原沢滋氏は、「データサイエンティストの知識と能力をソフトウェアに落とし込んだ。これまで1年かかっていた作業が1日や1週間で完了する」とメリットを説明する。
DataRobotの開発会社は米DataRobotで、日本に支社を置いている。NSSOLはリクルートに次ぐ国内2社めの販売代理店で、7月1日に取り扱いを開始した。NSSOLはシステムインテグレーターとして、ライセンスの販売だけでなく、導入コンサルティングや連携システムの構築などの周辺SIサービスを一貫して提供する。NSSOLの販売目標は3年間で30社30億円。
DataRobot ディレクター 原沢滋氏
DataRobotは、機械学習のうち“教師あり学習(Supervised Learning)”を自動化する。分類や回帰(数値の予測)に利用できる。例えば、2値分類の場合、それぞれのデータがTrueかFalseかを情報として与えて学習させる。こうして作成した予測モデルを使えば、新たなデータを与えるだけで、それがTrueかFalseかを判定できる。複数種類のアルゴリズムを使ってモデルを生成し、より精度の高いモデルを選ぶ。
データを登録して「何を予測するか」を選ぶだけ
使い方は簡単で、データを登録して「何を予測するか」を指定するだけ(図1)。これだけで予測モデルを自動で作成する。データは、外部データベースに接続できるほか、手元にあるデータもアップロードできる。ソフトウェアはウェブアプリケーションとして動作し、ウェブブラウザによる対話型の操作か、あるいはREST APIを介して、すべての作業を行える。
図1:DataRobotの使い方。ウェブ画面からデータを登録して「何を予測するか」を指定するだけで予測モデルを自動生成する
新日鉄住金ソリューションズ ソリューション企画・コンサルティングセンター 企画グループリーダー 三橋利也氏
特に、予測モデル作成後はREST APIを使うことで、他の業務システムに予測モデルを利用した自動判定の機能を組み込める。判定対象のデータをDataRobotに投げて判定結果を受け取れる。例えば、オンラインで個人属性を入力させて合否を判定する用途、物件情報を入力させて見積もり金額を生成する用途などに利用できる。
原沢氏は、DataRobotの特徴を「データサイエンティストの知識を誰もが簡単に使えること」とアピールする。「ソフトウェアを使うだけで、世界最高峰のデータサイエンティストのノウハウが得られる」(原沢氏)。新日鉄住金ソリューションズでソリューション企画・コンサルティングセンター企画グループリーダーを務める三橋利也氏も、「ソフトウェアの方が能力をスケールできる。より良い予測をより速く実現できる」と、ソフトウェアであることのメリットを説く。
説明会では、デモを実演してみせた。分析対象データとして、お金を借り倒した人と、お金を借り倒さずに返した人、それぞれの属性情報を集めたデータを利用した。これをアップロードして、お金を借り倒すかどうかに着目してモデルを生成して見せた。10分ほどでモデルが完成し、予測可能になった。「DataRobotを使わない場合、モデルの作成に1年かかる。システムへの組み込みにも時間がかかる。これを10分に短縮できた」(原沢氏)