treedown’s Report

システム管理者に巻き起こる様々な事象を読者の貴方へ報告するブログです。会社でも家庭でも"システム"に携わるすべての方の共感を目指しています。

※https化しました。その影響でしばらくリンク切れなどがあるかもしれませんが徐々に修正していきます。 リンク切れなどのお気づきの点がございましたらコメントなどでご指摘いただけますと助かります。

トラシューはコンピュータとコミュニケーションをとる

トラブルシューティング、って大変です。ハマり込むと何時間、何日、何十日、何カ月と同じ問題で悩むことになります。まさに問題の無限ループ。

でもちょっと待ってください。コンピュータはどこかにその問題の要因やヒントを提示してくれています。

それがログです。

ログ、こそがトラブルシューティングの第一歩

トラブルシューティングの一番最初に確認するのはログの記述です。ある程度の経験者であれば、この重要性は身に染みて分かっているはずです。
ログを解析するのはログが膨大な量であればあるほどに、遠回りに思えます。遠回りに思えますが、急がば回れの言葉にもあるように、膨大なログの中からトラブルシューティングの核となる記述を見つけ出すことが一番の近道となります。

以前にIEのトラブルシューティングでハマり込むことがありましたが、まさにこれが実践できてないがゆえに遠回りをすることになってしまいました。

blog.treedown.net

トラブルにはまずログ確認、これは忘れないようにしておきたいものです。

ログはシステムからのメッセージ

よく上司と部下の関係で、「部下は無言で上司にメッセージを出している」という主旨の内容が部下掌握術的なビジネス系書籍にはよく記載されている内容です。部下が(突然の退職などといった)問題を起こすとき、必ず前兆となるメッセージは無言で発信されている、という考え方です。
システムも同様で、障害が発生して具体的にトラブルが顕在化したのち、その顕在化するトラブルの前兆はかならずログに記述がある、ということです。突然の障害、ということであっても必ず突然障害が発生した主旨のログは記述があるはず、ということです。
(ログシステムに問題が発生していなければ、ですが。普段からログシステムといえど正常に動作するように注力しておかなければいけませんね。)

ログは起きたことを人間に伝えるための記録と言えます。いわば人間とコンピュータのコミュニケーション手段といってもいいかもしれません。
コンピュータは物言わず黙々と命令された作業を壊れるまでこなすのですが、何か動作上の問題が起きればログに記録されることになります。
人間側のシステム管理者はコンピュータの出すログというメッセージを受け取って障害対処にあたりトラブルを解消します。

つまるところトラブルシューティングは

コンピュータが教えてくれるメッセージを元に障害を解消するためにシステム管理者が手を動かす、というコンピュータとのコミュニケーションが重要な業務と言えます。昔の漫画で「ボールは友達」という名言がありましたが、これに近いですね。コンピュータとコミュニケーションがうまくとれるシステム管理者が障害においては優秀と言える、というわけです。

コンピュータと人間を同列として語るのはどうか、というところもありますが、対象が発しているメッセージを逃さないようにする、という点においては、コンピュータ相手も人間相手もあまり変わらない、ということも言えます。