「企業のファイルサーバは、過去3年間更新されていない死蔵ファイルが全体の41%を占めている。2次ストレージにアーカイブするか削除するかすべきだ」――。
ベリタステクノロジーズは3月23日、顧客企業のデータ構成を調査したレポート「Data Genomics Index」の日本語版をリリースするとともに、データのアーカイブや削除を支援するミドルウェアの新版をリリースした。
Data Genomics Indexは、米本社の顧客企業が実際に運用しているファイルサーバのファイル構成情報(メタデータ)を収集し、分析結果をまとめたレポートだ。日本語版は全16ページで構成する。整理対象のファイルを特定するのに役立つ知見が書かれている。これを参考にすることで、ユーザー企業はファイルサーバを効率よく使えるようになる。PDFファイルの形でダウンロードできる(リンクの有効期限は4月22日)。
ユーザー企業の実環境から収集したファイルサーバのメタデータを分析して知見をまとめた
レポートのハイライトはこうだ。10Pバイトのファイルデータを管理する典型的なユーザー企業の場合、3年間更新のない“陳腐化データ”(ファイル数にして約95億個)が使用済みの全ストレージ容量の41%を占める。これら陳腐化データの保管費用は年間で2050万ドルに及ぶ。
典型的なユーザー企業にとっての解決策は、Worや/Excel、PowerPoint文書とテキストという4つのファイル形式に着目し、これらの陳腐化データをアーカイブするというもの。これによりストレージ費用を50%(約200万ドル)削減できる。別の解決方法として、音声ファイルと動画ファイルをアーカイブ、削除することでストレージ費用を11%削減できる。
Veritas Technologies シニアプロダクトマーケティングマネージャー Christopher Talbott氏
ベリタステクノロジーズ 常務執行役員 テクノロジーセールス&サービス統括本部長 セールスエンジニアリング本部長 コンサルティング部長 高井隆太氏
陳腐化データの比率が高いファイル形式に絞って対処せよ
ユーザー企業が自社の陳腐化データを特定するやり方は2つあると、米本社でシニアプロダクトマーケティングマネージャーを務めるChristopher Talbott氏は指南する。
陳腐化データを特定するやり方の1つは、陳腐化データの比率が高いファイル形式に着目するというもの。典型的なユーザー企業では、画像、ドキュメント、映像、Excel、プレゼンテーション、音声という6つのファイル形式で顕著だ。
もう1つのやり方は、離職者が作成して誰もアクセスしていないファイルなど所有者が不明のファイルに着目するというもの。こうした所有者不明のファイルは全体の5%を占めているという。
ファイルサーバ構成分析ソフトとアーカイブソフトの新版を提供
ベリタスの常務執行役員でテクノロジーセールス&サービス統括本部長でセールスエンジニアリング本部長の高井隆太氏(コンサルティング部長)は、Data Genomics Indexで得られた知見を参考にツールを使って自社のファイル構成情報を分析することを提案する。「ファイル構成の可視性が高まれば、これまでのようなアーカイブという手段だけでなく、ファイルの削除といった一歩踏み込んだ対策もとれる」(高井氏)
ベリタスは、Data Genomics Index日本語版のリリースにあわせて、自社のファイル構成情報を分析するソフトの新版「Data Insight 5.1」と、メールデータをアーカイブ保存するソフトの新版「Enterprise Vault 12」もリリースした。
Data Genomics Index日本語版
Data Insightは、ファイルサーバの利用状況やアクセス権限などを調べるソフトだ。ファイルの所有者を推定する機能を備えており、ファイルの作成者だけでなく、誰がどんな頻度でアクセスしているかといった情報が分かる。新版では、ファイル共有サービスの「Box」を分析できるようにするなど、いくつかの機能を強化した。
Enterprise Vaultは、メールのアーカイブソフトだ。新版では、何をどんな条件でアーカイブするのかを細かく制御できるように強化した。
メールの文面からタイプを分類し、それぞれに異なるアーカイブポリシーを適用できる。また、イメージデータを光学文字読み取り(OCR)認識して文字を抽出できるようにするなど、検索機能を強化した。