編集部からのお知らせ
New! 記事まとめ「ISMAP-LIU」
話題の記事まとめ「通信障害と社会リスク」

データ予測モデルの自動生成、Sparkで110倍高速に--NEC、機械学習を強化 - (page 2)

日川佳三

2016-05-26 19:11

 予測精度の実験では、約2300万件ある全データをサーバ10台(メモリ2.5Tバイト)で分散処理させたケースと、あらかじめデータを分割してからサーバ1台(メモリ256Gバイト)で処理させたケースを比較した。

 速度の実験では、サーバ1台のメモリに全データが載るようにデータを1000万件に絞り、これをサーバ10台(128コア)で分散処理させたケースと、サーバ1台(1コア)で処理させたケースを比較した。

NEC データサイエンス研究所所長 山田昭雄氏
NEC データサイエンス研究所所長 山田昭雄氏

判断の根拠が人間に分かることが大切

 NECが異種混合学習技術(分散版を含む)で注力していることは、予測モデルの解釈性だ。NECでデータサイエンス研究所所長を務める山田昭雄氏は、「人間の意思決定を支援することを目的とした技術なので、判断の根拠を人間に説明できることが大切」と、技術の位置付けを説明する。

 例えば、深層学習(ディープラーニング)を使った画像認識などの場合、判断の精度が高いという結果がすべてであって、判断の根拠は分からない(図3)。一方で、異種混合学習技術が対象としているビジネス分野の分析では、予測モデルを人間が見て解釈できなければ意味がない。

図3:ビジネスの意思決定を支援するため、判断の根拠が分かるタイプの機械学習技術にNECは注力している(NEC提供)
図3:ビジネスの意思決定を支援するため、判断の根拠が分かるタイプの機械学習技術にNECは注力している(NEC提供)

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]