富士通研究所は8月21日、ビッグデータについてデータ分析の専門家が創出した分析シナリオを自動的に推薦する技術を開発したと発表した。富士通から今後リリースされる分析環境構築ミドルウェア「Interstage Business Analytics Modeling Server」に順次搭載されていく予定になっている。
ビッグデータからビジネスに有用な知見を得るには、分析するための基盤や技術、ツールに加えて、「どのようなデータを組み合わせて利用するのか」「分析結果をどのように解釈、活用するのか」といった分析シナリオが重要になっていると指摘されている。こうした分析シナリオを創出するためには、業務や業種などビジネスの知識と、統計やマイニングなどの分析知識の両方を持った人員、チームが不可欠であり、ビッグデータの利活用を推進する人材の育成と確保が、大きな課題ともいわれている。
今回、富士通研究所は、分析するプロセスをテンプレートとして設計、推薦することで分析の専門家が持つ知識やノウハウを簡単に再利用できるという分析テンプレート自動推薦機能を開発した。分析対象データの内容や特性にあわせて、適用できるテンプレートや追加データを自動で推薦する。このテンプレートがあるおかげで、高度な知識やノウハウを持っていなくても分析できるとメリットを説明する。
今回の技術は、分析の処理手順(プロセス)を、データ加工や分析処理を部品化した“分析部品”を組み合わせた“分析テンプレート”として設計する。分析テンプレートは、「どのようなデータを組み合わせて利用するのか」「データをどのように加工するのか」「どのような技術やツールを適用するのか」「分析結果をどのように解釈、活用するのか」といった分析の専門家のノウハウが、分析部品の組み合わせやパラメータとして表現されたものになる。
分析テンプレートを作成する時に、業務や業種のカテゴリ、分析目的といったメタデータ、対象となるデータの内容や特性を標準的に記述するデータモデルと対応付けることで、分析テンプレートを自動的に推薦できると説明する。
今回の技術では、データプロファイリング技術を利用している。データプロファイリング技術は、分析対象となるデータを指定すると、そのデータの各項目が意味するもの、データ量や分布などの特性を抽出、判定する。プロファイリングされた内容や特性を分析テンプレートと対応付けられているデータモデルとマッチングすることで、適用できる分析テンプレートが自動で推薦されるという仕組みになっている。
また今回開発した技術は、分析テンプレートを自動推薦する時に、指定された分析対象データだけで利用できる分析テンプレートだけではなく、別のデータを追加することで適用できる分析テンプレートも探索する。この別のデータを提示することで、異種、多様なデータの組み合わせパターンを見つけることも可能という。
種類が異なり、さまざまなデータを組み合わせて複合的に分析することは、よく行われている。単一のデータだけでは分からない、隠れた因果関係を発見、分析するからだ。だが、どれとどれを組み合わせて見つけるかは、分析の専門家のノウハウと試行錯誤が必要になる。今回の技術は、そうしたことも実現できるようになっている。
今回の技術を活用して現在、流通産業分野での顧客管理やマーケティング、レコメンデーション、品質管理、リスク管理などの業務に適用できる分析部品や分析テンプレートを開発している。同研究所がこれまでに開発した“市場不具合の予兆発見”“リスクシナリオ分析”などの独自技術を基盤にした分析シナリオを実行できる。今後は業種や業務の範囲を拡大させて、分析部品と分析テンプレートを整備していく予定と説明する。