ベリタステクノロジーズは、企業が所有する非構造化データの構成を捉えた調査結果の最新版「Data Genomics Index 2017」の日本語版を公表した。それによると、データが増加する勢いが圧倒的であることが改めて確認されたという。例えば、作成されるファイルの数は2年ごとに倍になるペースに少しずつ近づいているとのこと。
同調査は、企業のデータの管理の現状に疑問を投げかけ、作成、保存、管理されている非構造化データの本質を明らかにする取り組み。分析は「Veritas Information Map」から収集される匿名のメタデータに重点を置いており、データ環境の実際の構成を、正確かつ詳細に浮き彫りにすることができるという。
企業は、ビジネスの俊敏性向および顧客価値を創造するためにデジタル変革を推進し、人工知能(AI)、IoT、ブロックチェーンなどの新しいテクノロジに投資しており、データの量、種類、サイズはダイナミックに変化していく。しかし多くの場合、データ管理は手付かずであり、どのようなデータが管理下にあるのか、そのデータのガバナンスをどうすればいいのか、暗中模索の状態となっているという。今回のレポートによると、データプライバシーがますます重要になっている中、企業はデータの保存場所や種類を問わずに、データを可視化する必要に迫られているという。
2017年は、データが2016年に対して48.7%増加。作成されるファイルの数が2年ごとに倍になるペースに少しずつ近づいていることを意味するといい、また平均ファイルサイズは前年比23%増となった。
また分析した全データの50%以上が、開発者ファイル、データファイル(.datなど)、画像ファイル、不明なファイル形式で構成されていた。そして、不明なファイルは昨年に比べて51%増加している。これは、顧客データから価値を引き出して顧客価値を創造するためにカスタムアプリケーションの開発・利用が増加した結果、新しく多種多様な不明なファイル形式がより広いデータ環境に追加されていることを示しているという。
加えて今回の分析では陳腐化したデータの割合は2016年の41%に対して33%にまで減少した。これは、企業がROTデータ(冗長で古く瑣末なデータ)を積極的に管理し始めている兆候だとみられるという。しかし、これが新しい傾向なのか一時的な現象なのかは次回調査の分析結果が出るまでは分からないとしている。