「2018年には欧州でGDPR(一般データ保護規則)の運用が始まる。日本には個人情報保護法もある。ユーザー企業は、ストレージに保管しているファイルの中に、個人情報を含んだファイルがどれだけあるのかを把握しなければならない」
米Veritas Technologiesは「NetBackup」や「Backup Exec」などのデータバックアップソフトウェアやメールアーカイブソフト「Enterprise Vault」、法規制による開示要求に素早く対応するためのソフト「eDiscovery Platform」など、データの保護やガバナンス(統制)のためのソフト群を提供している企業だ。
同社は、ユーザー企業が保有するファイルの属性情報(メタデータ)をクラウドで収集して可視化する「Infomation Map(InfoMap)」と呼ぶ仕組みを持っている。ユーザーは、Veritasのバックアップソフトでデータをバックアップするだけで、これらのファイルのメタデータをInfoMapのクラウドに報告できる。
2018年1月、InfoMapのクラウドで集めたメタデータを解析した年次レポートの最新版(2017年版)として『2017 Data Genomics Index』を公開した。メタデータは世界14カ国から集めており、サイズは20ペタバイトにおよぶ。集めたメタデータから、8000種類のファイルタイプを識別し、ストレージの利用状況を分析した。
レポートによると、2016年から2017年にかけて、ファイル数、データ量、データの種類などが、ともに増えた。ファイル数は、2016年の180億から2017年には310億に増えた。データ量の成長率は、2016年が前年度比39%であるのに対し、2017年は前年度比48%に向上した。2年で2倍になる成長率に近づきつつある。
データベースのコピーからの情報漏えいに注意せよ
データの種類も増えた。InfoMapでは8000種類のファイルを識別できるが、InfoMapでも識別できないファイルが増えている。
「デジタル変革によって革新的な製品を出していかなければならないことが理由となって、新しいファイルタイプが次々と生まれている」(米Veritas Technologiesでグローバルソリューションマーケティング、GDPRおよびeDiscovery担当を務めるDavid Moseley氏)
ストレージ容量の5%を占めるデータが、データベースの内容のコピーを保存したデータベースダンプだ。システム管理者は、オフラインで簡単にデータにアクセスできるように、軽い気持ちでデータベースのコピーを作成するとMoseley氏は指摘する。しかしこれは、個人情報の漏えいリスクを高める。「GDPR対応にとって懸念事項の1つとなる」(Moseley氏)
米Veritas Technologiesでグローバルソリューションマーケティング、GDPRおよびeDiscovery担当を務めるDavid Moseley(デビッド・モーズリー)氏
特定の業界では、特定の種類のファイルが占める率が高くなる。例えば、官公庁と教育分野は、画像ファイル(JPEG)が多い。紙をスキャンして画像化して保管するという需要があるからだ。実際に、データ量の28.4%(官公庁)や23.1%(教育)を、何らかの画像ファイルが占めている。
金融業界では、契約書が紙ベースであることから、文書ファイルがデータ全体の20%を占める。「今後はスマートコントラクト(電子契約)の浸透によって文書ファイルは減っていくが、書類の保管義務などの規制があるため、金融業界の変革のスピードは緩やかだ」(Moseley氏)