データ人材の育成は広がりつつあるが……
データ人材の育成というと数年前はエンジニアリング部門を対象にしたり、事業部から選抜したりするケースが多かった。しかし、2019~2020年にかけて、全社的もしくは部門全体でデータ活用に取り組もうとしている企業が増えているように思う。
部門または全社的にデータ活用に取り組もうとしている企業では、既にDX(デジタル変革)推進部やデータ活用チームといった組織があり、そのような部門からデータ人材育成の研修を依頼されることも多い。弊社はデータ人材を育成する研修を行う会社であるが、そのような企業から依頼を受け、現場の社員の方向けに研修してみると意外な声を聞くことが少なくない。例えば、以下のような声だ
- 「BI(ビジネスインテリジェンス)ツールの研修も受講して、ツールの使い方は分かったものの、うちの会社ってそもそもデータがないんですよね」
- 「データはあるにはあるけど、どんなときにデータを使えばいいのか分からないんですよ」
- 「定期的に分析レポートが配信されるものの見る気にならない。手元の数字とそのレポートの数字が微妙にズレているから参考にしていいのかも怪しい」
よくよく聞いてみると、このような課題感の背後には大きく分けて3つの原因があると筆者は考えている。そこで、今回は組織でデータ活用を阻害する原因について考えてみたいと思う。
分析に使えるデータとして整備されていない
組織でデータ活用が進まない原因の1つは「データ」そのものに関する課題だ。いざ「データ活用だ」と言って取り組み始めたものの、現場からは「使えるデータがない」という意見が上がってくることも少なくない。この「使える」という言葉にはいろいろな意味が含まれていることに注意しなくてはならないが、筆者が知る限り、以下の3つの要素をいずれか含んでいる。
1.そもそもデータが蓄積されていない
筆者の経験で言えば、本来、過去データをログとして蓄積しておくべきところを、データを上書きするという運用を行っているケースがあった。業務上、過去データを見ることはほとんどないという理由から、このような運用となっているとのことだったが、データを上書きしてしまうと分析する際には非常に困ったことになる。例えば、過去から現在までの変化を分析したいとなった場合には、データがないため分析できなくなってしまう。
2.データが汚くて前処理をしないと使えない
「データが汚い」というのも多義的であるが、例えば、データそのものが本来複数の列に分かれて格納されておくべきものが1つの文字列になってしまっていたり、データベースのあるフィールドに異なる定義のデータが格納されていたりするケースが該当する。
より具体的にいえば、それまで「備考」として使っていたフィールドを、ある日を境に「返品の伝票番号」が入ってくるといった別の定義のデータを入れ始めてしまうようなケースだ。もちろん業務上やシステム上の都合があるとは思うが、データ分析という観点から見ると「データが汚い」ということになってしまう。データが汚い場合の解決策はデータマートの作成である。
データマートとは、元のデータをクレンジング(整理)する処理を行い、ユーザーが使いやすいように整形したデータのことをいう。データマートを用意して、いざ利用が始まればさまざまな要望がデータ利用者から上がってくることになり、より使いやすいデータマートへと進化させることができる。
3.データが各部門で個別管理になっており統合できない
データが部門ごとに管理されており統合されていない、もしくは統合できないというケースもデータ活用におけるよくある課題の1つだ。
例えば、デジタル関連のビジネスをやっている部門は独自のデータベースを作っているものの、他部門のデータとはひも付けにくい状態になってしまったり、複数の企業を買収してきたような企業の中で出身母体ごとに異なる「顧客マスター」「取引データ」「契約データ」が存在したりといったケースだ。
このような状態を「サイロ化」と呼んでおり、「データレイク」といったソリューションを使って解決することになる。少し脱線するが、サイロ化が良くない状態であるという論調があるが、これまで業務を細分化・分業することで生産性を上げてきたわけなのだから、データがサイロ化しているのは当然であり、現在データがサイロ化していたとしても決して悲観することはないと個人的には考えている。
このように、現場ではどのような形になっていると使いやすいのかという理想形を描き、その理想形から逆算してデータを統合・整形する処理を検討していくことが重要である。また、一度データを準備したら終わりではなく、継続的に見直して、より使いやすいデータの形とは何かを追求していくことも重要だと考える。