データサイエンティストのスキルセットと役割
機械学習プロジェクトに必要な人材やチーム体制について説明する時、データサイエンティストと呼ばれる職種について触れずにおくことはできません。データサイエンティスト、という言葉はよく耳にしますが、スキルや役割について明確なイメージを持っている方はまだ少ないように感じます。
そのため、ここでは一般的に言われているデータサイエンティストとしてのスキルセットや、機械学習プロジェクトのメンバーとしての関わり方を説明したいと思います。
データサイエンティストのスキルセットとして、よく言及されるのは下記の3つの領域です。
【データサイエンティストに求められるスキル(一例)】
- ビジネス理解力:
- 理論構築力:
- エンジニアとしての開発力:
● ドメイン知識を持ち、ビジネス的な観点からも考えられる
● 技術的な成果をビジネスにつなげられる
● 統計や機械学習の理論を理解している
● 課題に合わせ、解決のために上記の知識を応用できる
● 統計言語の「R」やPythonを用いて自分のアイデアを試すことができる
● データを適切な形でビジュアライズ(画像・グラフ・図・表などにビジュアル化)できる
実は、上記の3つの領域は前半で説明した「機械学習プロジェクトでの3つの役割に必要なスキルセット」と対応します。
では、「データサイエンティストが1人いれば、機械学習プロジェクトは成功する」と言えるのでしょうか。
ビジネスの各領域において広い知識と専門性が求められる中、実際には上記の3つすべての領域に完全に精通することは難しいと言われています。
データサイエンティストの多くは全体的に高い水準の専門性を身に着けつつ、自身のバックグラウンドに応じて特に強みを発揮できる領域を持っています。
そのため、最近では「すべての領域に精通した1人のデータサイエンティストがプロジェクトを推進する」という考えではなく、「データサイエンティストを中心としつつ、複数のメンバーが専門的な知見や経験を活かしてプロジェクトを推進する」という考え方が主流になっています。
データサイエンティストについては、大きく2つのタイプに分けられます。
【データサイエンティストの2つのタイプ】
- AI(人工知能)型人材:
- BI(ビジネス・インテリジェンス)型人材:
● 機械学習などの理論に明るく、プログラミング力も備える
● 機械学習や画像認識など、機能開発を得意とする
● 統計理論に明るく、分析結果のビジネス的な解釈に長けている
● KPI設計や事業構造の理解まで含め、ビジネス系の分析を得意とする
上記の2つのタイプのスキルセットなどについては、次回で詳しく説明します。
プロジェクトメンバーのアサインと進行
これまで説明してきたように、機械学習プロジェクトは、要求されるスキルの異なる複数のフェーズで構成されます。そのため、さまざまなスキルを持ったメンバーでチームを作って推進していきます。理想的には、各フェーズをおおむね理解していて汎用的に対応できるデータサイエンティストをチームの中心に置きたいところです。
最初の機械学習プロジェクトでは、初めて一緒にプロジェクトを推進することになるメンバーもいるでしょう。そのため各人の強みを生かせる主な担当フェーズをお互いに理解し、総合力の高いチームビルディングを目指すことで必要です。よいチーム作りに成功すれば、機械学習プロジェクトの成功確率を高めることができるでしょう。
- 田中耕太郎(データサイエンティスト)
- 東京工業大学大学院にてMOT(技術経営専門職)を取得。 在学中より研究開発系の大学ベンチャーにて企業戦略の策定、マーケティングに従事。 IT系ベンチャーにて主に事業企画、プロジェクトマネジメントを経験後、 コンサルタントとして大手企業や官公庁のデータ分析案件を担当。 データサイエンス領域では機械学習の活用、統計を用いた事業分析を専門に行い、 組織の立ち上げ、データサイエンティストの採用や育成にも注力。 現在はC2Cの領域で、主に事業状況の可視化やビッグデータ分析を担当している。