[コレが気になる!]
サーバートラブルで3時間の停止
昨日弊社内でサーバーやディスクが次々停止するトラブルがありました。古い
電源ケーブルが原因なのか、そこにつながっている公開用Linuxサーバ1台、イ
ントラネット用サーバー1台、バックアップ用ディスクが全て起動しなくなり
ました。
復旧作業をするにあたり、公開しているサーバーをどの状態で復旧させるべき
か考えました。「現在サーバーが停止しております」というページを作り、公
開すべきかということが一番の課題でした。幸い3時間程度で復旧する目処が
たったので、何もしないでおきました。
以前、別のサーバーでトラブルにあった際「現在サーバーが停止しております」
というメッセージを表示したまま24時間ほど経過したことがありました。運
が悪く、検索エンジンのクロールのタイミングと重なりました。そのころは月
に1度程度のディープクロールであったため、次回のクロールは1ヶ月以上先
となりました。本来をリンクを張り合っていたページもこのクロールの時点で
全てリンクがなくなってしまった状態です。その為、1度のクロールではサイ
ト全てのページを取得出来ず、階層が深いページは再掲載まで4ヶ月もかかっ
てしまったのです。アクセスは半分以下に激減しました。
現在は検索エンジンのクロール周期が短い為、このようなことは起きにくい様
ですが、それでも階層の深いページは一度インデックスから消えてしまうと復
活は時間がかかる様です。index.htmなどに停止メッセージを出すのではなく、
きちんと技術の人と相談して、503エラー(WWWサーバが一時的にサービスがで
きない状態を示すエラー)を返す様に設定した方がいいでしょう。
サーバーのダウン、知らせるのは人だけではなく検索エンジンもあるというこ
とを忘れずに。
2004.09.22