データサイエンティストの定義とは
--データサイエンティスト協会の代表理事も兼務しているが、データサイエンティストの定義をどう考えるか。
先日、データサイエンティストの定性的な定義は発表しましたが、定量的となると難しいですね。データサイエンティストといっても、一般の人とデータの意味を解釈、理解しながら使っていける人、コンセプト自体、業界全体に影響を及ぼせるような大きなことを考え、実行できる人など、何段階かあります。
強いて言えばデータをマネジメントするITスキルと、データを分析するアカデミックな知識を含めた分析能力、そしてそれをビジネス、実社会に活かしていくためのビジネス能力が求められます。
それに加えて、ビジネスドメインに関する知識と、分析した課題を集めてきて、分析した結果をオペレーションに反映していくためのコミュニケーション能力、説得する力、それぞれの濃淡とそのバランスも求められるため、定義が難しいのです。
一方、今後は、認定資格を作るとまではいかなくても、キャリアを積むためにどういう経験を積んでいく必要があるのかなど、ガイダンスとして出していく必要があるという話はしています。

--データサイエンティストとして向上するために必要なことは。
ひとつは最低限のアカデミックなバックグラウンド、数式が読めてそれをアルゴリズムに落とせる能力が必要です。ここまで覚えれば終わりではなく、どんどん新しい手法が提案されていますので、それをどんどん試して特徴を把握し、新しい課題が出てきたときに最適な手法を選んで結果を想定できることが求められます。
分析には終わりがありません。違う手法ならもっといい結果が出るかも知れませんが、やり過ぎると儲からない仕事になってしまいます。適当なところで見切りをつけて、利益を出しながら工数をコントロールすることが大事になります。
一方で新しいことも試さなければならないので、独習力や学ぶ力、ベースに理論を理解するような最低限のアカデミックなバックグラウンドがないと難しいでしょう。
ツールに実装されているアルゴリズムしか試せないようでは、最先端より一歩も二歩遅れてしまいます。最低限、言われたことを分析として回すような下のレイヤの人は、まず統計を理解してツールをいじれるということになりますが、上のレイヤに行くほどフロンティアで定義することが難しくなります。
一方でコミュニケーション能力はもちろん、もし規模の大きいチームを率いる場合、リーダーシップも求められます。こういう人がいるのかというレベルに近づきますね。