「週に1度のフルバックアップ」というルール
バックアップの種類には、フルバックアップ、増分バックアップ、差分バックアップの3種類がある。
フルバックアップは、バックアップ対象のデータを無条件にすべてバックアップ対象とする。増分バックアップでは、前回実施されたバックアップ以降に増えたり変更されたりしたデータをバックアップする。差分バックアップでは、前回実施されたフルバックアップ以降に増えたり変更されたりしたデータをバックアップする。
一般的に、週に1度フルバックアップを実行し、それ以外の日には増分(または差分)バックアップを実行することが推奨されている。
※クリックすると拡大画像が見られます
このバックアップの典型的な手法は、テープを使ったバックアップでのリストアの手間を抑えるために考えられた手法である。例えば、毎週月曜日にフルバックアップを実施し、火曜日から金曜日までは増分バックアップを実施しているケースがある。木曜日に障害が起き、水曜日にバックアップした時点にデータを復旧したいとする。
その場合、直近の月曜日のフルバックアップが保管されているテープを使って、リストアする。そのあと、火曜日の増分バックアップのテープと水曜日の増分バックアップのテープを使って、それぞれのデータを戻す。使うテープは3本だ。
差分バックアップでは、月曜日のフルバックアップと水曜日の差分バックアップとで合計2本ですむ。フルバックアップを週に1度実施することで、使用するテープを最大5本(週に5回バックアップを実行していると仮定。差分バックアップなら2本)に抑えることができるのだ。
さて、ここで疑問には思わないだろうか? このバックアップ手法は、テープを使うことが前提に考えられている。最近ではディスクストレージの低価格化に伴い、テープに変わってNASやUSB接続のストレージにバックアップされることが増えてきている。
ディスクなら毎日同じディスクにバックアップをする。リストアも同じディスクから行うので、テープで懸念されているようなテープの入れ替えの手間や読み書きのタイムロスを気にする必要がない。ディスクで同様に、週1度のフルバックアップを実施する運用には、ムダがあるのではないだろうか?
1週間で増加するデータ量はどれぐらいか
典型的な企業では、ファイルサーバのデータ容量は年間40~60%の割合で増加すると言われている。仮に1週間に増加するデータ量が1%だとすると、1年間に68%増加する計算になる。つまり、通常はこれより少なく、1週間で1%以下しかデータは増えないのだ。
さて、あなたの会社では、一般的に言われる“推奨されるルール”にしたがって、週に1度フルバックアップを実行していないだろうか。今週実行したフルバックアップのうち、99%以上は、先週のフルバックアップとまったく同じデータを重複して取っていることになる。長期にわたって、このルールで運用すると、莫大な量になることは容易に想像がつくだろう。
重複排除の仕組み
企業活動を支えるITシステムへの重要性が高まる一方、データ量は増加の一途を辿っている。それにも関わらず、バックアップデータは長期にわたって保管することが求められている。これを解決するために登場したのが、バックアップデータの「重複排除」という仕組みだ。シマンテックの製品を例にすると、「Symantec NetBackup」と「Symantec Backup Exec」の両方で、同じ仕組みの重複排除を適用することができる。