編集部からのお知らせ
解説集:台頭するロボット市場のいま
解説集:データ活用で考えるデータの選び方
海外コメンタリー

「シチズンデータサイエンティストとは何か」をあらためて考える

Forrester Research (Special to ZDNet.com) 翻訳校正: 石橋啓一郎

2019-04-19 06:30

 最近では誰もが「シチズンデータサイエンティスト」を話題にしているにも関わらず、それを定義できる者はいないようだ(ひょっとすると、見れば分かるという前提なのかもしれないが)。

 シチズンデータサイエンティストのもっとも簡単な定義は、「データサイエンティストではない人」だろう。もちろんこれは卑下しているわけではなく、データサイエンスを利用したいという意思は持っているが、データサイエンスのライフサイクルのあれこれを正式に習った経験がないという意味だ。例えばシチズンデータサイエンティストは、モデルを構築する際にどの企業データが重要になる可能性があるかを熟知していながら、GBMとランダムフォレストとSVMの違いは知らないかもしれない。多くのシチズンデータサイエンティストにとって、これらのアルゴリズムの名前はデータサイエンティストの内輪の言葉だし、シチズンデータサイエンティストの仕事は、データサイエンスではなく、それを道具として使って自分の仕事を片付けることだ。

 筆者は、シチズンデータサイエンティストを「機械学習などのデータサイエンスのテクニックを使って、業績の改善に役立つ知見の獲得や、予測モデルの構築を行おうとしているビジネスパーソン」と定義している。

シチズンデータサイエンティストは逞しさを必要とする

 シチズンデータサイエンティストになるには、この副業に熱心に取り組む必要がある。なぜなら、データサイエンスは簡単ではないからだ。それにはまず、データの取得、データの準備、特徴量エンジニアリング、アルゴリズムの選択、モデルのトレーニング、モデルの評価、そして知見や予測の獲得からなる、データサイエンスのライフサイクルを学ぶ必要がある。また、RやPythonを使ったプログラミングも覚える必要があるかもしれない。ただし運が良ければ(そして賢ければ)、「RapidMiner」や「KNIME」などのツールをダウンロードして、面倒なコーディングではなく、視覚的なドラッグアンドドロップのインターフェースで作業できるだろう。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

Special PR

特集

CIO

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. クラウドコンピューティング

    AI導入に立ちはだかる「データ」「複雑さ」「コスト」「人材」の壁をどう乗り切ればいいのか?

  2. クラウドコンピューティング

    【IDC調査】2026年には75%のアプリがAIを実装!導入で遅れた企業はどう“逆転”すべきか?

  3. 運用管理

    経産省調査で明らかに:未だにレガシーシステムを抱える企業が8割!オープン化でよくある課題とは?

  4. 運用管理

    AWS東京リージョンの大規模障害に学ぶ、パブリッククラウド上のシステムの迅速な復旧方法

  5. windows-server

    【ユースケース】ソフトウェア開発にDell EMCインフラ+コンテナを使うメリット

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]