情報ライフサイクル管理のためのソフトウェア
追加的なデータ保持の義務を課せられている業界(医療業界など)を除けば、小さな企業で発生するデータはそれほど大きく増えているわけではなく、専用のソフトウェアパッケージを使わなくとも、社内のIT部門で情報ライフサイクル管理に対応できる水準のはずだ。もちろん、重要なデータについてはどんな場合もそうだが、冗長データやバックアップは用意しておくべきだ。
大量のデータが発生する中規模から大規模の組織では、規制に対するコンプライアンスを考えれば、高品質な情報ライフサイクル管理ソフトウェアを使うようにした方が無難だろう。
- IBMの「System Storage Archive Manager」は、情報ライフサイクル管理のためのパッケージソフトウェアとして有名だ。このソフトウェアは、ストレージ利用料を節約するための重複排除機能やマルチティアストレージ管理機能を持っている。
- Oracleのエコシステムをすでに利用している組織であれば、Oracleの「Information Lifecycle Management」スイートは検討に値するだろう。このソフトウェアは、自動圧縮ユーティリティやストレージのティア作成・管理機能を提供している。
コンプライアンスのコストをどう考えるか
現実的に考えれば、ストレージコストは、コンプライアンスを無視するコストよりも低い。たとえばGoogleの新ストレージ製品「Cloud Nearline」では、1カ月あたり1Gバイトにつき0.01ドルしかかからない。標準的なストレージと比較すると、取得には数秒かかるが、同じ水準の価格で提供されているストレージサービス「Amazon Glacier」の取得時間が数時間単位であることを考えると、ずっと高速だ。
長期間保管することを考えると、必要な容量を少しでも減らす観点から、圧縮技術についても検討する必要があるだろう。有名な「7-Zip」でも使用されている圧縮アルゴリズム「LZMA」は、データベースなどのテキストベースの記録であれば、ファイルサイズを最大で85%、一般的なケースでは60%から70%減らすことができる(LZMAは他のアプリケーションやLZMA SDKでもサポートされている)。ただLZMAには、解凍にはあまり時間がかからないが、圧縮には状況や使用するハードウェアのパワーによって、数時間かかる場合もあるという欠点がある。現時点では、圧縮比と処理時間のバランスがもっともよいのは「bzip2」だろう。ただし、圧縮ファイルのサイズはLZMAよりもやや大きくなる。
最後に
コンプライアンスを無視すると罰金や民事訴訟の対象となる可能性があるため、情報を削除してしまうよりは、保持しておいた方が安全で、コストパフォーマンスも高い。ディスクやクラウドストレージの価格は下がり続けているため、山のような書類をファイルキャビネットで管理していた時代に比べれば、データ保持の負担もかなり下がっていると言えるだろう。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。