treedown’s Report

システム管理者に巻き起こる様々な事象を読者の貴方へ報告するブログです。会社でも家庭でも"システム"に携わるすべての方の共感を目指しています。

(3/5)がんばっていればいいことあるさ

ログの確認と症状の再現を提案しましたが、カバ雄君はどのように判断するか、気になるところです。

昨日の記事:(2/5)がんばっていればいいことあるさ - treedown’s Report
から続きます。

ログの確認

ですが、カバ雄君はあまりピンと来なかったようです。

「ログをリアルタイムに表示する?何ですか?それは。」

ちょっと冷たい言い方に聞こえました(たぶん気のせい、ということにしておく)が、どうやらやり方を知らないようです。
ですが、ここで目を丸くしたチームリーダーが再び、
「tailコマンドだろ、確か-fオプションで画面表示するやつだ。」
たまにチームリーダーも使っているコマンドなので覚えていたようです。チームリーダーが知っているってのは話が早いですね。カバ雄君にアレコレ説明する必要が省けます。
「早くやりなよ。」
チームリーダーが急かします。障害中ですからね。

渋々(に見えた)カバ雄君は、コマンドを打ち始めます。
ログがリアルタイムに画面表示され始めました。さて、ようやくスタートです。
実際に別のPCで動作を再現します。二・三回やっていると応答しなくなる症状が出てきました。
さあ!いまだ!
ログはどうなっている?
興味深くログが表示されている画面を見ましたが、内容を確認する前にカバ雄君が結論を教えてくれました。

「何も出てきませんね。ログには何もないってことです。」

ダ、ダメだったか…。

チームリーダーは意を決して発言を始めました。
「じゃあ、再起動しよう。だって、どうしょうもないよね?」
聞かれたカバ雄君は

「仕方ないですね、それでいいと思います。」

助け舟を得たような気分になったのか、ちょっと晴れやかな表情を見せ再起動に同意していました。
個人的に再起動で問題解決というのは、問題の先送りにしか思えないのであまり歓迎できないのですが、現状ではあまり効果的な助言もできないようなので、私も発言を控えるようになっていました。
ログの確認がスカだったので、ちょっと恥ずかしかった、と言うのも多少あります。
何にせよ障害の解消が優先されるべきだ、と自分を言い聞かせるようにしていました。

チームリーダーは、晴れやかなカバ雄君を見て、
「じゃあ、我々は何人かでユーザに再起動することを説明しに行ってくるから、再起動の準備をしておいて。」
とカバ雄君に言うと、私と近くにいた他数名に指示を出し、一緒に部屋を出ていくことになりました。

ユーザへ周知

リーダーと手分けして別の階の部署も含めて直接触れ回ることになりました。各々部署に散らばってユーザのところで、「すいませーん。システム再起動しまぁーっす。」ってユーザに言って回ることで、概ねユーザのOKは取れました。
無線LANも拠点間接続もなかったころの社内システムはとにかく自席でパソコンの操作をしている人に直接言って回ればよかったので、一番早い伝達方法は「走って直接言って回る」でした。
幸いそれほど使っている最中の人数は多くなく、使っていないユーザにとっては「あーそんなことあったのー。」くらいの温度感だったのは救いです。

連絡を終えたリーダーと別のフロアで全員が合流すると、リーダーはカバ雄君に携帯電話で指示を出しているところでした。
「もう、再起動していいよ。」
チームリーダーは全員がそろったのを見計らって電話でそう指示を出しました。

再起動することで、応答なしの症状は復旧し、オオゴトにならずに済んだようです。

その場の一同は一通りやり終えた感覚になっていました。