「ビッグデータ」という言葉を、本稿の読者であれば聞いたことがあるだろう。Googleトレンドによれば、この言葉は2011年の後半からニュースに登場するようになり、2012年、2013年と、年を追うごとに取り上げられることが増えていることがわかる。
Gartnerによると、2012年は58%、2013年は64%の企業や機関がビッグデータテクノロジへの投資を検討、あるいは実施しているとされている(※)。活用の機運は、確実に高まっていると言えるだろう。
その一方で、ビッグデータ活用とは具体的にどんなことができて、実現には何が必要なのか、はっきりとした答えを持つ人はあまりいないのではないかと感じている。
筆者は2012年から、現在の職場である富士通で、さまざまな業種業務のデータ分析を手掛けてきた。この連載では分析の実務者の立場からデータ活用について語っていきたい。なお、本連載で述べるのは筆者の個人的な意見である点を了承されたい。
今回は、データ分析を担う「データサイエンティスト」と、データ活用を考える「意思決定者」の間のコミュニケーションについて、特にデータ活用の目的を明確にすることの重要性を語る。
ビッグデータの隆盛とともに、目に触れる機会が増えた言葉がある。「データサイエンティスト」もその1つである。一般に、ビッグデータ分析の担い手として語られることの多いこの言葉は、ビジネスにおけるデータ活用に必要な知識、スキルを一通りそろえた人物、その職業を指したものである。
データサイエンティストのスキルセットについてはさまざまに言われているが、概ね「ビジネス理解」「統計解析などの数理モデリング知識」「データのハンドリング能力」の3つを指すことが多いようだ(話の本筋とは関係ないが、これらのスキルを全て備えた人物はなかなかいないため、実際の現場ではこの3つを分けたり併せたりして分担し、チームで仕事にあたることが多い)。
ビッグデータ活用を、ひとまず「データによる意思決定」のことであると定義したときに、データサイエンティストはかなり多くの役割を演じる。とはいえ、データサイエンティストが意思決定まで担うことはあまりなく、データサイエンティストの分析結果を元にして、意思決定者が別にいるというケースがほとんどだろう。
筆者の関わる典型的なプロジェクトでは、顧客の業務データをお預かりするとともに、業務課題などのお題を必ずいただくことにしている。お題に対する知見を、データ分析から生み出すことがプロジェクトの目標である。こう書けば単純なことのように思えるが、お題がそれほどはっきりと固定されておらず、データを見ながら決めていくという場合もある。
また、分析の設計や定式化、パラメータなど、分析の設定には無限の選択肢があり、その中から適切なものを探すという作業は、かなり細かい考察を要する。コミュニケーションによって分析の方向性を定めていくことが多いが、詳細については結局分析者の裁量になることが多く、そのため、分析者が細かい部分で判断をする指針が必要になる。
判断に迷った時、筆者はいつも「データ活用の目的に沿っているか」というところまで立ち返ることにしている。目的が十分に具体性を持っていれば、これを指針として分析を設計できるのである。
(※)Gartnerプレスリリース「Gartner Survey Reveals That 64 Percent of Organizations Have Invested or Plan to Invest in Big Data in 2013」 2013年9月23日