NEC、ビッグデータ予測を自動化する「予測分析自動化技術」を開発

NO BUDGET

2016-12-24 07:00

 NECは12月15日、業務システムで幅広く使われるリレーショナルデータベース(RDB)での大規模データ予測分析プロセス全体を完全自動化する「予測分析自動化技術」を開発したと発表した。企業の重要な経営情報などが保存されている大規模なデータについて、新たな潜在ニーズの発見に基づいた戦略立案、仮説検証、施策実施など迅速化な事業判断に貢献するという。本技術を用いて、三井住友銀行、日本総合研究所、NECで共同実証を行った結果、専門分析者により2~3か月かかる分析作業が、精度を維持したまま1日に短縮できたとのこと。今後は、本技術を企業が自社でビッグデータ分析が可能なサービスとして、2017年度の提供を目指す。

 複数のデータベースから構成されるRDBを分析する際、現在では熟練したデータサイエンティストが不可欠となっており、データベース間の複雑な関係性の発見や関連づけ、機械学習による予測モデルの調整などに多大な工数を要している。この熟練データサイエンティストは世界的にも顕著に不足している人材で、急増する高度なデータ分析ニーズに応じて迅速に大規模データ分析をするためには、非熟練者でも利用可能な、容易かつ高精度な分析手段が求められている。

 この課題に対しNECでは、2012年にビッグデータに混在する多数の規則性を自動で発見する分析手法「異種混合学習技術」を開発して以来、データ分析の前処理技術として、「特徴量自動設計技術」(2015年発表)を開発するなど、データサイエンティストが人手で行っていた高度な作業(データの関係性発見、特徴量の抽出・設計から分析モデル作成まで)を高精度に自動化する研究開発を進めてきた。今回開発した予測分析自動化技術は、これらの技術を発展させたもので、RDBの大規模データに対する予測分析の完全自動化を可能にする。


データ分析のプロセス

 新技術の特徴は以下の通り。

  • 特徴量自動設計技術を強化し、RDBから特徴量を自動で発見
  •  本技術では、2015年に発表した特徴量自動設計技術を強化し、業務システムで幅広く使われるRDBから、特徴量を自動で設計するようにした。具体的には、分析対象となる複数のデータベースの関係性から、予測に有効なデータ項目の組み合わせ(特徴量)の仮説をAIが高速で探索し発見していく。また、このプロセスで必要となる膨大な数の検索式(クエリ)の生成もシステムが自動で行う。

     これにより、分析経験やデータに対する知見に頼っていた特徴量の仮説立案や、データベースを操作して特徴量を作成する多大な作業が不要となり、分析を大幅に短期化・省力化することができるという。また、人手による分析をはるかに越える大量の仮説探索を短時間で実行できるため、分析結果の高精度化や、人が気づかない新しい知見の発見も可能とのこと。

  • 「予測モデル自動設計」により複数モデルから最適なものを自動で選択
  •  特徴量のデータをもとに、NEC独自の異種混合学習(複数の規則性を自動で発見)やロジスティック回帰(発生確率を予測)、決定木(樹木状のモデルにより要因を分析、結果から予測する手法)いったさまざまな機械学習手法を用いて作成された大量の予測モデルから、ユーザーが目的とする分析結果に最適な予測モデルを選択、あるいは組み合わせを行う。また、予測モデルで算出された予測値について、予測根拠(なぜそのような予測になるのか)も提示する。

     今回、直観的に操作できるGUIを開発し、画面の指示に従う簡単な操作で、多大な工数がかかっていたデータの特徴量探索、予測モデル作成を実現した。これにより、データ分析に関する高度なスキルがなくても、短時間に熟練データサイエンティストと同等以上の精度で予測分析が可能になるという。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

自社にとって最大のセキュリティ脅威は何ですか

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]