treedown’s Report

システム管理者に巻き起こる様々な事象を読者の貴方へ報告するブログです。会社でも家庭でも"システム"に携わるすべての方の共感を目指しています。

※https化しました。その影響でしばらくリンク切れなどがあるかもしれませんが徐々に修正していきます。 リンク切れなどのお気づきの点がございましたらコメントなどでご指摘いただけますと助かります。

Windows11 SSD消失問題の一次対処(たぶん)

この問題が更新プログラム(KB5063878など)と関連しているかどうかという点は確認できていませんが、SSDのドライブの消失不具合と似た症状が発生したため、対処しました。

いろいろな情報があって不明な不確実な話も多いため、現状はトライアンドエラーの域を出ませんが、確認したこととやってみたことを記録しておきます。

症状とその環境

クライアントHyper-Vで利用しているWindows11(24H2)で8月の更新プログラム適用後しばらくは特に問題なく動作していたのですが、バックアップジョブが失敗しているアラート・ログで、SSDドライブのボリュームがOSから認識できなくなっていることに気づきました。

Hyper-Vコンソール画面から確認すると、案の定、「仮想マシンの構成記憶域に接続できません」と表示されていました。

ゲストOSを保管しているSSDドライブがOSから認識されなくなっていたので、構成ファイル(.vms)とかVHDにアクセス出来なくなっているという状態です。

このドライブはUSB接続のSSDドライブ(かつRAID構成可能な外付けドライブでRAID 0で構成した状態)です。いったん「OSを起動し直す(再起動や電源OFF)」「USBケーブルを抜く」「外付けUSBドライブの電源を再投入」などを実施することで、消えていたドライブを再度認識させることはできました。

ディスクの管理「S:」がそのボリュームです。ディスクの管理画面からもエクスプローラからも症状が発生したときにはドライブは見えない状態になっていました。(OS再起動だけでは認識せず、USBケーブルの挿し直しやドライブの電源再投入が必要になりました。)

調べる

以下(二つ)を参考にさせていただきました

www.nichepcgamer.com

note.com

ここによれば、SSD消失問題は

  • 条件1:ドライブの空き容量(使用率60%超)で空き容量40%未満のSSD
  • 条件2:使用率60%超のSSD環境で50GB以上のファイルを移動やコピーで書き込みをする

この条件を(AND条件で)満たすと発生するらしいということが読み取れました。

条件1のディスク容量は、

対象のドライブは使用量70%、空き領域は残30%です。

確かに8月の更新プログラム適用後(しばらくは大丈夫だったけど)に、Hyper-Vゲストのバックアップ(いずれも50GB超のVHDファイルを複数)を実行しようとしたタイミングで発生したという動きから、この条件に引っ掛かったということなんじゃないかと考えました。

実施したこと(経過観察中)

実施したことは単純で、この対象ドライブの使用量を減らすこと、保存されていたデータのうち移動できるデータを別ドライブのHDD(HDDはSSDと違ってSSD消失問題の影響を受けないらしい)に移すことで、SSDの使用率を60%未満に減らすようにしました。

VHDの「容量可変の拡張仮想ハードディスク」をメインで利用しているため、使用量が増えてVHDファイルが容量を拡張したとしても60%を超えないように、最低限のファイルだけを置くようにしました。

症状が発生していたときには、クライアントHyper-VのゲストOSに負荷が掛かるとボリュームが見えたり見えなかったりと不安定になることもあったのですが、使用率を60%未満にした後は、

ある程度負荷が掛かったとしても動作してくれましたので、これでいったん様子見をすることにしました。

ちなみに、問題の発端となったHyper-Vゲストのバックアップジョブもエラーなく、SSDドライブ消失といった症状も発生せず、バックアップが完了していることを確認しました。

一次対処完了

こうして、ひとまずは対処完了と判断し、この後は経過観察とすることにしたのですが、SSDドライブ消失の問題は環境によって症状が様々ですし、そもそも何が根本的な要因なのかという点がはっきりしていない点が問題としては根深い印象です。

今回は、ボリューム消失も再起動やUSBケーブルの再接続といった対処で再接続できたから良かったものの、パーティションテーブルの破損などでRAWドライブとなってしまうと故障と区別が付かない(ハードウェアとしては故障していないのに故障してRAW化したように見える)というのも困ったところです。

この環境では、当面は使用率60%未満の空き容量を確保した状態で稼働させるように心掛けて稼働するようにします。ただ、容量がもったいないのでできれば解決に向かって欲しいですが。