treedown’s Report

システム管理者に巻き起こる様々な事象を読者の貴方へ報告するブログです。会社でも家庭でも"システム"に携わるすべての方の共感を目指しています。

※https化しました。その影響でしばらくリンク切れなどがあるかもしれませんが徐々に修正していきます。 リンク切れなどのお気づきの点がございましたらコメントなどでご指摘いただけますと助かります。

玄箱ProのDebianバージョンアップ後にビープ音

玄箱ProにインストールしてあるDebianのバージョンをJessieからStretchにバージョンアップしたあとの話。
なんだか不定期にビープ音がなるので、探ってみましたのでご報告。
まだ原因は確定していませんけども。

前回「玄箱ProバージョンアップDebian Stretchへ - treedown’s Report」バージョンアップした玄箱Proの内の一台がなんだか動作不調。

バージョンアップ後にビープ音

二台の玄箱Proバージョンアップが完了したあと、そのうちの一台が
「不定期にビープ音が鳴る」
という状況に。
とうとう故障なのか?と思ったけども、見た目には正常動作しているように見える、故障の前兆なら予防保守したいところです。

ちょっと探ってみようとやってみた記録。

結論から言うと

結論から言うと、どうも温度を監視している機能がビープ音を鳴らしてくれているらしい。
と、いうのもtail -f /var/log/syslogで監視しつつビープ音の鳴るタイミングを調べていたら、ビープ音が鳴った直後に
--------------------------------------------------------------
kuro-box smartd[1879]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 100 to 101
--------------------------------------------------------------
SMARTが「温度 - 摂氏100から101に変更」と言っています。このタイミングでビープ音が鳴る、しかしもう片方はこの温度変化が記録されていない、ってことで、筐体の放熱の問題なんだろうな、って結論に達しました。

でもファンが壊れている(ファンが回転しなくなった)というワケではなく、ファン自体はしっかり回転しています。埃も掃除しましたけど、温度は上昇=ビープ音、ってことでお手上げ。

結局のところ、この結論で本件は終了しました。

これ以降は、あれこれとやってみたものの効果がなかった内容です。

調べた感じHDD故障?

ネット上の知見に頼ろうと思ったけど、同じ症状の情報に出会えず。
不定期にビープ音、ってことで別の機種ではHDDの故障だったという話があったので、ひとまずSMART情報を確認してみようと考えました。
ひとまず、smartctlコマンドを使ってHDDのSMART情報を閲覧するためにsmartmontoolsをインストールします。

# apt-get install smartmontools

インストールが動作したら、おや?と思うメッセージが多数出力されました。

インストール実行すると…

「apt-get install smartmontools」実行後に見慣れないエラーが
--------------------------------------------------------------
.../smartmontools_6.5+svn4324-1_armel.deb を展開する準備をしています ...
smartmontools (6.5+svn4324-1) を展開しています...
smartmontools (6.5+svn4324-1) を設定しています ...
Created symlink /etc/systemd/system/multi-user.target.wants/smartd.service → /lib/systemd/system/smartd.service.
Failed to reload daemon: Refusing to reload, not enough space available on /run/systemd. Currently, 11.0M are free, but a safety buffer of 16.0M is enforced.
/usr/bin/deb-systemd-helper: error: systemctl preset failed on smartd.service: No such file or directory
Failed to reload daemon: Refusing to reload, not enough space available on /run/systemd. Currently, 11.0M are free, but a safety buffer of 16.0M is enforced.
Failed to reload daemon: Refusing to reload, not enough space available on /run/systemd. Currently, 11.0M are free, but a safety buffer of 16.0M is enforced.
Failed to reload daemon: Refusing to reload, not enough space available on /run/systemd. Currently, 11.0M are free, but a safety buffer of 16.0M is enforced.
systemd (232-25+deb9u9) のトリガを処理しています ...
Failed to reload daemon: Refusing to reload, not enough space available on /run/systemd. Currently, 11.0M are free, but a safety buffer of 16.0M is enforced.
man-db (2.7.6.1-2) のトリガを処理しています ...
--------------------------------------------------------------
ん?
デーモンの再ロードに失敗しました:再ロードを拒否しました。/ run / systemdに十分なスペースがありません。現在、11.0Mは無料ですが、16.0Mの安全バッファが適用されています。
ではdfコマンドで確認してみると、
--------------------------------------------------------------
# df -m
ファイルシス 1M-ブロック 使用 使用可 使用% マウント位置
udev 59 0 59 0% /dev
tmpfs 13 2 12 9% /run
/dev/sda2 938181 148851 741651 17% /
tmpfs 61 0 61 0% /dev/shm
tmpfs 5 0 5 0% /run/lock
tmpfs 61 0 61 0% /sys/fs/cgroup
/dev/sda1 228 35 182 16% /boot
--------------------------------------------------------------
/runがマウントされているtmpfsは13MB、2MB使用中で残り11MB(使用可のところは12ってなっていますが)
これがエラーの原因なのかなぁと思ったものの、smartmontoolsのインストールは正常に完了したらしく、smartctlコマンドは正常に実行できました。
--------------------------------------------------------------
# smartctl -a /dev/sda
省略
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
省略
--------------------------------------------------------------
特にエラーもなく、正常に動作しているらしい、ということが分かりました。

故障じゃないのかな?

tmpfsのマウントポイント/run

となると、tmpfsでマウントしている/runが怪しいってことになります。
一つには/runの領域を増やしてしまえばいいと単純に思って、
mount -t tmpfs tmpfs /run -o remount,size=16M,nosuid,noexec,relatime,mode=755
とコマンドを実行しようと思ったとき、ふと気づいたのが、
「不要になったパッケージを削除し忘れていたな…。」
と、いうことで、
# apt remove
で不要になったパッケージを削除し掃除完了。
--------------------------------------------------------------
# df -m
ファイルシス 1M-ブロック 使用 使用可 使用% マウント位置
udev 59 0 59 0% /dev
tmpfs 13 2 11 14% /run
/dev/sda2 938181 148703 741799 17% /
tmpfs 61 0 61 0% /dev/shm
tmpfs 5 0 5 0% /run/lock
tmpfs 61 0 61 0% /sys/fs/cgroup
/dev/sda1 228 29 188 14% /boot
--------------------------------------------------------------
tmpfsの/runの使用可の値が12⇒11に減少しました。

結局これでもビープ音が鳴るのですが、syslogを監視しながらビープ音のタイミングを待っていたら、結論に記載したログを見つけました。
このため/runの領域を拡張するmountコマンドは結局実行せず。

よくよく考えてみたら、同条件で二台の玄箱Proをバージョンアップしたあとに、一台だけこの症状が起きている、って考えると、単純に/runの領域を増やすってのは対処としてはなんか違うのかなと思いました。

f:id:treedown:20190406130306p:plain

最後に、何年も掃除してなかったので、埃除去。