こんにちは。株式会社パイプラインの濱田です。
前回は障害発生時の初動に観察力が大事であると述べました。
今回は、観察力とセットで非常に大事な検索力について取り上げます。
「なぜ検索力が大事なのか」
なぜ障害発生時に検索力が大事なのでしょう。決まった作業手順書に従って対応してはいけないのか?という声もあるのは重々承知です。しかし、毎度毎回障害が発生するたびに原因究明もせず同じ手順で“なんとなく”復旧したように見えて、それは根本解決なのだろうかと、私は逆に問いたいのです。
WEBサーバーやDBサーバーをはじめ、あるプロダクトへの機能 非機能に対する期待は非常に大きくなっています。
例えばnginxの機能一覧だけでも、こんなにあるのです。しかも多数のパラメータが設定できるとなると、あらゆる機能すべてから原因究明を行うのは非現実的で、何かしらの絞り込みを行う必要があります。そもそも、WEBサーバーの障害でメールプロキシの機能を最初に疑うことはほとんどないでしょう(絶対ないとは言いません)。
(この続きは以下をご覧ください)
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。