Michael Cavaretta氏はデータを欲している。丸ごとのデータが欲しいのであり、データ以外は不要だ。この記事では、今注目のIT関連の仕事の1つであるデータサイエンティストとして、同氏がどのようなことをしているのかを紹介する。
Cavaretta氏にいくらデータを与えても与えすぎということはない。
同氏はFord Motor Companyで16年近く、データサイエンティストとして働いている。そして特に、最高経営責任者(CEO)のAlan Mulally氏の任期が始まってからの過去8年間は、データ(それもたくさんのデータ)こそが同氏の信念だった。
提供:ZDNet
Cavaretta氏は自らの役割を何通りかに分けて考えている。1つ目としては、データサイエンティストだ。同氏はデータサイエンティストのグループのマネージャーでもある。
「つまるところそれは、社内や社外のデータソースから価値を引き出す仕事だ。一番重要なのは、さまざまなツールやテクノロジを幅広く使うことだと考えている。つまり、コンピュータサイエンスや統計学、機械学習といった分野を利用するということだ」(Cavaretta氏)
Cavaretta氏の2つ目の仕事は、データが持つ意味を社内のほかの人々に伝えることに関連する。同氏はそれを、ストーリーテリングだと考えている。インフォグラフィックスや、何らかの可視化ツールを使って、「社内の人たちの質問に自分たちが特定の方法で答えるのはなぜかを理解できるように、データの意味を説明する」ことだと、Cavaretta氏は語る。
それはCavaretta氏の3つ目の仕事である領域知識(domain knowledge)と関連がある。Cavaretta氏は、データを扱う側と、ビジネスを扱う側のギャップを埋める手助けをしている。ほかの人々がどういう人々で、何を求めているのかを理解することは、データ利用の改善に役立つ。
「人々がファイナンスの視点から物事について話しているとしたら、ファイナンスの言葉を話せるようになる必要がある」(Cavaretta氏)
ITの世界では、ビジネスへの理解がますます重要なスキルになっている。この2つの分野の合流点は、最近退任したFordのCEOのMulally氏が2006年に入社したときから、同社が特に重きを置いていることだ。
Mulally氏のモットーは、「データがあれば自由になれる」だった。
Cavaretta氏はコンピュータサイエンスで博士号を取得した。専門は人工知能で、最適化問題に関心を持った同氏は、進化的アルゴリズムと呼ばれる分野を特に研究した。それは、リソースの問題を解決するために、人工的な集団を考えるという手法だ。
その後、Cavaretta氏はChurchill Systemsというコンサルティング会社で働き始めた。この会社は、SearsやKmartのような大規模小売業者のプロモーション需要を予測する専門技術に力を注いでいた。
1998年にCavaretta氏がFordのリサーチ&イノベーション研究所に加わったころ、同社はデータマイニングチームを立ち上げようとしていた。以来、そのチームや手法は変化した。現状では、Cavaretta氏の部門のうちの1つには、約35人のメンバーがいる。
Mulally氏が2006年に就任した後、会議で「データはどこだ」と聞かれるようになった幹部たちが、ほどなくCavaretta氏や同氏のチームに対して意思決定などの支援を求めてくるようになったという。Cavaretta氏は「(Mulally氏が)Fordにこのデータ中心かつ分析の文化を持ち込んだことで、状況は本当に大きく変わった」と振り返る。
このデータの話をもっと具体的に説明するために、3回点滅するウィンカーの話をしよう。Fordがヨーロッパで販売していた「Fiesta」を米国でも販売しようとしたとき、3回点滅した後、自動的にオフになる仕組みのウィンカーを搭載するかどうかで議論になった。