ILMとは、情報の生成から廃棄まで、その情報の価値に応じてサービスレベルを設定し、活用するという概念です。そして、ILMの目的のひとつは、増え続けるデータを、最適な投資・運用コストで、確実かつ最適なストレージに格納することです。
ここで言うストレージは以下の5種類に分類できます。
- ディスク装置のように、アクセススピードは速いがビット単価(価格・容量)が高価な装置
- テープ装置のようにアクセススピードは遅いがビット単価が廉価な装置
- NAS(Network Attached Storage)といわれるファイルサーバの専用機
- CD-ROMなどのように、一度書き込まれた後は変更や削除できないWORM(Write Once Read Many)装置
- コンテンツ(データ)の読み書きに特化し、コンテンツに対して任意の保存期間を設定するなど長期保管を目的にしたCAS(Contents Addressed Storage)と呼ばれる装置
データへのアクセス条件や保存期間などの条件にあわせて、これらのストレージのタイプ別にデータを配置し、最適なコストパフォーマンスを得ることが、ILMの目的です。
企業内のデータを見てみると、データベースのような構造化されたデータが約20%、文書ファイルなど構造化されていないデータが80%となっています。ここでは、その80%に相当する構造化されていないデータのILMを説明します。
構造化されていないデータとは、一般的なOA(Office Automation)環境で取り扱われる文書や表計算、プレゼンテーションなどのファイルを指します。これらのファイルの特徴として、「業務を効率よく進めるためには、ファイルの共有が必要である」という点が挙げられます。従って、個人PCのディスクでは無く、共有可能なファイルサーバ上にファイルを格納します。この用途としては、NASが多く使われています。
次に、ファイルがどのように使われているかを考えてみます。報告書を例に取ってみましょう。報告書は、作成中の場合や提出した直後であれば、情報の鮮度が高く頻繁にアクセスされますが、1カ月を経過すると通常アクセスされません。また、決算報告書などは、会計年度始と末には頻繁にアクセスされますが、それ以外の時期はほとんどアクセスされません(図1)。