#5:RAIDアレイの状況を監視する
筆者は、RAIDアレイの不良によって痛い目にあったクライアントを数多く知っている。故障したドライブの存在に気付かないまま冗長ドライブを使い切り、最終的に障害を発生させてしまうというわけだ。こういった事態は簡単に避けることができる。アレイの状況を監視し、故障したドライブをその都度交換していれば、障害が発生するようなことにはならないわけだ。なお、RAIDアレイというものは、バックアップとして取り扱うべき性格のものではない(一部の人々はそう考えている節がある)。RAIDドライブの状況を常に監視するということは、破滅的な損失を避けるうえで、必要不可欠な作業と言えるだろう。
#6:オフサイト側でバックアップをローテーションする
建屋が全焼した場合、そこに保管されているバックアップは役に立つのだろうか?耐火金庫に保管しておくという手もあるが、それで本当に万全と言えるだろうか?(少なくとも)週に1度はオフサイト側にバックアップを取得するよう、システムの設定を行っておいてほしい。実際のところ、絶対に復旧しなければならないというのであれば、外部ドライブは3セット用意しておく必要があるだろう。つまり、これらを作業用と耐火金庫保管用、オフサイト保管用として使用するわけだ。これにより、ローテーションの頻度が増えるものの(各バックアップを陳腐化させないようにするため)、利用可能なバックアップを常に準備できるようになる。
#7:ネットワークについて文書化しておく
サーバやクライアントのソフトウェアについて文書化するだけで作業を終えてはいけない。ネットワークに関する情報も文書化しておく必要があるのだ。どういったものをどのように使っているのかや、アドレスの採番形態、セキュリティ対策について押さえておいてほしい。こういった文書を手近なところに用意しておくことで、ネットワークの復旧作業はずっと容易なものとなるはずだ。また、適切な文書化が行われていることも確認しておいてほしい。解説だけでなく図を活用するのもよいだろう。文書が十分に明確かつ包括的なものとなっており、ネットワーク管理者であれば誰でも迅速にネットワークを再構築できるようになっているかどうか、確認しておいてほしい。
#8:ウェブサイトのフェールオーバ機能をオフサイト側で実装しておく
ここまでで解説してきたバックアップ計画すべてを正しく運用するというのは重要なことだ。しかし、災害時でも収益のためにウェブサイトの運用を継続しなければならないのであれば、サイトのサーバが停止した時にオフサイトのサーバに容易に切り替えられるよう、フェールオーバ機能を実装しておく必要もある。こういった設定を行う場合には、切り替え時に古いサーバイメージを使用してしまわないよう、定期的にオフサイト側のシステムを更新しておくようにしてほしい。