treedown’s Report

システム管理者に巻き起こる様々な事象を読者の貴方へ報告するブログです。会社でも家庭でも"システム"に携わるすべての方の共感を目指しています。

※https化しました。その影響でしばらくリンク切れなどがあるかもしれませんが徐々に修正していきます。 リンク切れなどのお気づきの点がございましたらコメントなどでご指摘いただけますと助かります。

RAID1の外付けHDDが故障して諦める

RAID1を構成可能なUSBハードディスクケースをRAID1で使っていたのですが、復旧不可能な障害に遭遇してしまい、最終的に諦めた、という内容のご報告です。

使っていたディスク(ケース)

ロジテックのLHR-2BRHU3というHDDを2台搭載可能なUSB接続のHDDケースに、WD Redの4TBを×2台搭載して、RAID1(ミラーリング)を構成してデータ保管用のHDDとして使っていました。

4TBという容量は手持ちのHDDの中でも最大の容量なので、ISOやRaspberryPiのイメージバックアップ、Acronis TrueImageで取得したWindowsのイメージバックアップと、容量が大きいデータを中心に保管していたHDDです。

ある日、このHDDにアクセスするとエラーが出るようになっていました。

発生したエラー(画面)

HDDドライブにエクスプローラ経由でアクセスすると、

「ドライブ D:」が対象のUSBハードディスクドライブ、「使うにはフォーマットする必要があります。」に続いて「フォーマットしますか?」という表示。

いったんキャンセルボタンをクリックして抜けると、

「D:\ にアクセスできません。
このボリュームは認識可能なファイルシステムではありません。必要なファイルシステムドライバが全て読み込まれているか、ボリュームが壊れていないか確認してください。」

と表示され、データが読み出せなくなっていました。

ディスクの管理(diskmgmt.msc)でディスクの状態を確認してみると、

NTFSでファイルシステムがフォーマットされていたはずのドライブは「RAW」と表示されており、正常に動作していないことを示していました。

要因を考える

要因を考えたとき、二つの可能性がパッと頭に出てきました。

  • ファイルシステムが破損している
  • ハードディスクが破損している=故障

確かにエクスプローラの表示が引っ掛かるような遅さを出していた症状はたまにあったのですが、USB接続のHDDでエラーを出していたせいで発生していたとは考えていませんでした。

ファイルシステム破損かディスクの故障かを切り分けるためにディスクチェックを実施し、

ディスクチェックでエラーなし、正常判断=ファイルシステム異常・破損
ディスクチェックでエラー検出=ハードディスク故障

と切り分けることにしました。

ディスクチェック、やってみれば…

こうして大容量ハードディスクということもあり、なかなかに時間が掛かりましたが、ディスクチェックを実施した結果、不良セクタが検出されることが分かりました。

不良セクタか…、これで故障ということが切り分けできたわけですが、そこはRAID1、二台で冗長化しておりますので、もう一台からデータは回収可能なはず…、と思っていました。

しかし、RAID1でミラーリングしていた二台目のHDDを接続してみると、一台目と同じように、

「使うにはフォーマットする必要があります。」に続いて「フォーマットしますか?」という表示からの、「D:\ にアクセスできません。このボリュームは認識可能なファイルシステムではありません。必要なファイルシステムドライバが全て読み込まれているか、ボリュームが壊れていないか確認してください。」

と表示されてしまいます。RAID1で構成したHDDは一台目も二台目も同様にRAWフォーマットとなっていました。

4TBのデータが吹っ飛んでいそうな予感、イヤな感じがしてきます。

二台目のハードディスクもディスクチェックで正常性を確認してみることにしました。故障ディスクからのミラーリングを受けてコッチはファイルシステム破損、ということもあるかもしれないし。

と、辛抱強くディスクチェックの完了を待つと、ディスクチェック途中の処理で不良セクタの発生、ディスクチェックが進まなくなってしまい、中断を余儀なくされるような状態に。

ちょっと現実を受け入れられなかったのですが、

結局のところ、

blog.treedown.net

これが再び起こってしまったようです。(※今回はSSDじゃなくてHDDだけど、RAID1を過信していたというのは同じ)

結論「別装置へのバックアップ」が必要だった

結果的に、昔自分で考えていたこと

blog.treedown.net

これの文中にある「メディアとして同じ媒体を使っていれば、故障時期が相似するのはやむを得ない。」という前提に目を瞑ってRAID1ならそうそうデータロストはないだろうという油断が4TBのハードディスクに溜め込んだデータロストを招いてしまったようです。RAID1なんだから同じHDD×2台で構成するし、寿命が似通った同一HDDなのだから同時に不良セクタが発生したとしても不思議じゃない。

ISOやイメージバックアップの保管場所ということもあり、読み出しのほうが多くて書き込みはあまり無かったというのも油断をしてしまった要因でした。

ちょっとダメージが大きいので、現実を受け入れるのはちょっと時間が必要なようです。そっと電源を落として、ペンディングすることにしました。