はじめに
企業のデータ活用が実践フェーズに入り、「ビッグデータ」という言葉の普及とともに、ビジネスに与えるインパクトとその実態が明らかになってきている。
多くの企業が自社にとってのビッグデータの位置付けを理解し、競争力強化のためビッグデータを用いた大小さまざまな取り組みを本格化させている(※1)。
本稿では、ビッグデータの本質は「Analytics」の繰り返しであるという前提に立ち、「ビッグデータアナリティクスを加速化するオープンソース活動」というテーマで、最新のアナリティクスを実現する包括的な方法論、またアーキテクチャやソリューションについて、今後事例も踏まえ全6回にわたりお伝えする。
「Analytics」とは何か
Analyticsは、似たような単語、「Analysis」と同様に「分析」と訳されることが多いが別ものである。Analyticsとは、「データの中に意味のあるパターンを探索し、解釈し、そして伝えること」とされ、さらにディープラーニングを含む予測モデル構築まで含むという。
これは、人間が日常で当り前のように繰り返している思考過程「出会った事象を構成要素に分解し、その構造を組み立て、次に同様の事象が生じた際にどう対処すべきか予測する」(畑村式「わかる」技術、畑村洋太郎、講談社現代新書)行為と同じである。(図)
図
またAnalyticsとは、広義の分析であり「思考、論理、(狭義の)分析」( 『思考・論理・分析』波頭亮、産業能率大学出版部)の過程といえる一方、「Analysis」とは狭義の分析であり「事象を最小構成要素に分解していく作業である。本編においてはこの定義に基づき解説する。
オープンソース活動が生み出した2つのイノベーション
ビッグデータが実現する事は、全ての事象がアナリティクスの対象となり、ビジネスの当事者たちが、アナリティクスを通して何らかの恩恵を多く受けるようになっていることである。
例えば、小売業界にて消費者の属性情報、ライフステージ、購買履歴、最近の趣味嗜好などありとあらゆることがデータとして取れた場合、最適なタイミングで最適な商品をリコメンドできることで、販売店は効率的に売り上げを伸ばせる。
また水稲農業における稲の生育状況や水田の成分、水の温度などの必要な情報を全てデータ化し、分析することで、今まで人間の経験と勘に頼っていた部分を仕組み化できるということである。
今、2つのイノベーションが既に起こっている。それは「1.データ収集に関するイノベーション」と「2. アナリティクス・ソリューション実現に関するイノベーション」だ。