予測精度の実験では、約2300万件ある全データをサーバ10台(メモリ2.5Tバイト)で分散処理させたケースと、あらかじめデータを分割してからサーバ1台(メモリ256Gバイト)で処理させたケースを比較した。
速度の実験では、サーバ1台のメモリに全データが載るようにデータを1000万件に絞り、これをサーバ10台(128コア)で分散処理させたケースと、サーバ1台(1コア)で処理させたケースを比較した。
NEC データサイエンス研究所所長 山田昭雄氏
判断の根拠が人間に分かることが大切
NECが異種混合学習技術(分散版を含む)で注力していることは、予測モデルの解釈性だ。NECでデータサイエンス研究所所長を務める山田昭雄氏は、「人間の意思決定を支援することを目的とした技術なので、判断の根拠を人間に説明できることが大切」と、技術の位置付けを説明する。
例えば、深層学習(ディープラーニング)を使った画像認識などの場合、判断の精度が高いという結果がすべてであって、判断の根拠は分からない(図3)。一方で、異種混合学習技術が対象としているビジネス分野の分析では、予測モデルを人間が見て解釈できなければ意味がない。
図3:ビジネスの意思決定を支援するため、判断の根拠が分かるタイプの機械学習技術にNECは注力している(NEC提供)