米航空宇宙局(NASA)のピープルアナリティクス部門責任者代理兼シニアデータアナリストのDavid Meza氏は、あらゆるデータが優秀なデータサイエンティストを確保するのが困難であることを示しているが、NASAでさえ事情は同じだと述べている。
では、NASAではどんなスキルギャップが起こっているのだろうか。Meza氏のチームは、まだNASAのデータサイエンス人材需要について「深く掘り下げている」段階だが、組織内にいる人材を見つけることに関しては、すでに明確なパターンを生み出しつつあるという。
「以前から、NASAが抱えている最大の問題は、必要なデータサイエンスのスキルを持った人材が組織のどこにいるかを特定することだった。政府内には、データサイエンスという用語や、この言葉が肩書きに付いた職業があるわけではない。『データサイエンス』を専門とする役職や職業を設けることはまだ進んでいない」と同氏は言う。
確実に分かっているのは、NASAには組織のあちこちにデータを扱える人材がいるが、NASAが行っている業務の幅があまりに広いため、そうした人材の一部は、簡単に見つけたり分類したりすることができないということだ。
「何しろNASAは、その手の仕事を沢山やっている」とMeza氏は言う。「私たちは、どの部門でどのようにどんな分析を行っているかを調べた上で、それ以外の各人材のデータリテラシーを特定する必要がある」
その仕事を進めているのがMeza氏チームだ。同氏のチームは、あらゆる種類のプロジェクトに関して、そのプロジェクトが必要とするデータスキルを特定できる人材マッピングデータベースを作成している。ここで言うプロジェクトは、月面への再着陸や火星探査から、気候変動や航空工学、医学研究などの地球上の諸問題に関する科学的活動まで多岐に渡る。
「NASAでやっている仕事の幅は非常に広い。このため、適切な人材を適切な場所に配置するために私たちが特定すべきデータセットやスキルセットも多岐に渡っている」とMesa氏は言う。
このためNASAでは、データサイエンスを使うことで、データサイエンスのスキルギャップを埋めようとしている。Meza氏が開発している人材マッピングデータベースでは、「Neo4j」の技術を使ってナレッジグラフを構築している。ナレッジグラフとは、データ間の複雑かつ多様な関係性を表現するための技術だ。今回の場合は、NASAが抱えている人材と、スキルと、プロジェクトの間の関係性がデータベースに収められている。