観測困難なダークデータが引き起こす情報爆発 企業は、増大するデータの管理と削減にどう対処すべきか

 ビジネスにおいて、デジタルテクノロジーの活用が益々重要になる中で、ビッグデータによる情報爆発に注目が集まっている。特に、構造化/非構造化データが混在し、人間のみが判断できる「ダークデータ」が、データの活用を難しくすると共に、管理コストとリスクを押し上げている。今回は、このようなダークデータの特徴を紹介すると共に、データガバナンスにおける対処方法について解説する。

 企業活動は、デジタルテクノロジーによって、情報爆発ともいえる拡大を見せてきた。圧倒的な量とスピード、多様なデータ形式を持ち、新たなビジネスチャンスを生み出す源泉として注目を集めると同時に、IT全般統制の面で脅威となりつつある。

 米国のIT専門リサーチ会社ESG(Enterprise Strategy Group)によると、このような企業データは、全世界において1分間あたり1820テラバイトのペースで増大しているという。 たとえば、企業データ成長率は12-18ヶ月ごとに2倍になっており、全世界のデータの90%は、この2年以内に生成されている。そのうち、非構造化データが90%を占めており、電子化されていないデータも約2%存在している。

 企業のIT部門も、この状況をもちろん認識している。前述のESGレポートによれば、「2015年のIT優先事項トップ10」のうち、1位は「情報セキュリティ」、2位は「データバックアップとリカバリの改善」、3位が「データ増加と管理」になっている。いずれの事項も、データの管理自体が重要な要素となっているものだ。

 こうした事態は、ストレージのコスト増加も生み出している。ある企業では、IT予算の約30%がデータストレージに使用されている中で、毎年データが平均30%増加している。ただし、企業データの最大70%は価値を生み出さないものだ。つまり、ただデータを蓄積するためだけに、膨大なコストを費やしているのだ。

 欧米においては、これにコンプライアンス上の問題が加わる。膨大なデータを抱えることは、それだけでリスクの増大を招くのだ。たとえば、データ損失の平均コストは約6億7千万円、電子情報開示の平均コストは1億8千万円にのぼるという(1ポンド=192円換算)。また、EUにおいて、一般データ保護規則の違反があった場合の罰金は、136億円または取引高の2%になる(2017年以降、1ユーロ=136円換算)。さらに近年では、すべての顧客に対する「忘れられる権利」への対応を考えていかざるを得ないと言われている。日本においても、個人情報やマイナンバー対応に関連して、プライバシーへの配慮の必要性は益々高まるだろう。

爆発する情報の大部分は、観測困難な「ダークデータ」が占める

 「企業に蓄積された膨大なデータのうち、活用できる価値が低いにも関わらず、保管コストと情報漏えいも含めたリスクのあるデータが、企業の情報統制外に"ダークデータ"として相当量存在していると言われています」

 このように語ってくれたのは、日本ヒューレット・パッカードで、ソフトウェア事業統括 インフォメーションマネジメント事業本部 事業戦略室の室長を務める徳久 賢二氏である。

 こうしたダークデータが存在する典型的な場所が、SharePointやロータスノーツなどのグループウェア/コラボレーションシステムや、ファイルサーバー・電子メールサーバーなどである。人間が読むことでしか理解できず、長期間使用されずに孤立しているデータが、管理されないまま膨大に蓄積されているのだ。

 このようなダークデータは、最初から価値が低い訳ではない。データのライフサイクルの観点で見れば、保存期間の当初約10%では、クリティカルかつ価値が高いが、10%から20%の期間では、日常的に使用されるにとどまり、残りの70%の期間では統計的なサンプルとして利用されるだけで、個別の情報としては極めて価値の低いものになってしまう。従業員の古いPCのマイドキュメントのバックアップが、10年近くファイルサーバーに温存されているといった例が、どこの企業にも存在しているのではないだろうか。

 企業の情報統制戦略外に存在している、このようなダークデータは、次のように3つの課題を抱えている。

ダークデータ/レガシーデータに伴うリスク ダークデータ/レガシーデータに伴うリスク
※クリックすると拡大画像が見られます

 まずは「コストの悪循環」である。データを保存する範囲が拡大するにつれて、それに伴うストレージコストに影響を与えると共に、情報漏洩の対応コストも増大させる。そのため、賠償費用や電子情報開示に伴う訴訟コストも増加させる。2番目の課題は「セキュリティ被害や企業イメージ・信頼へのダメージ」である。ダークデータでは、個人情報や機密情報などが保護・監視されない状態になりがちである。情報漏洩や悪用のリスクが高まると共に、漏洩自体を検知することも難しくなる。3番目の課題は「業績やビジネス成果への悪影響」である。古いデータに基づいたビジネス判断は、それだけでビジネス成果の低下につながる可能性を秘めているし、データの再作成に伴って、無駄な人的リソースを消費することにもなりかねないのだ。

 しかし、このようなダークデータの削減は、個々の従業員のファイルサーバー容量を制限するだけでは難しい。どのようなデータに価値があるのか、いちいち判断するのは膨大な手間がかかってしまうため、単に古いデータを削除するだけで終わってしまうのだ。そして、法的に保存しておく義務のあるデータや統計的に優位なデータも、一律に削減されることになり、逆にリスクを高めたり、ビジネス価値を損なう結果をもたらすのだ。

提供:日本ヒューレットパッカード株式会社
[PR]企画・制作 朝日インタラクティブ株式会社 営業部  掲載内容有効期限:2016年4月27日
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]