2011年1月10日月曜日

Solaris10のブートディスクが死んだ(と思った)


このエントリーをはてなブックマークに追加


検証でよくiSCSIサーバや、NFSサーバを務めていた、Sun Ultra 24のSolarisが起動できなくなった。

このマシン、OS領域はUSBメモリx2をZFSでミラーリングしていたんだけど、
久々に zpool status 見たら片側のUSBメモリにエラーが多すぎるって出てた。

zfs scrub rpool したらしばらくUSBにアクセスした後にだんまりになり、固まってしまった。

しょうがないのでリブートすると、起動してこなくなってしまった。


うーん、困った。


家のデータはすべてこのマシンに2TBのHDD x4をRAIDZにして突っ込んでいたので、
そっちのデータは生きていると思うが、いかんせんOSが起動しないので取り出せない。

家のマシンはどれもHDDスロットが4つしかないものばかりなので少々めんどくさい。

しかも家のHDDで2TBの容量のものは、このRAIDZに突っ込んでる以外ないんだよね・・・w
うーん、USBメモリ買うのも、このためにもう一個2TB買ってくるのもなー。

とりあえずは、Solaris10のインストールメディアで起動して、zpool import してみる。

お、この状態でUSBの領域も、HDDの領域もちゃんと見えてるじゃん。
ということで、rpool を import してみると、両方のUSBメモリともONLINEで、ミラーを認識している。

zpool scrub rpool してみると、いくつかの再同期が走って今度は正常に終了。
なんか拍子抜けだ。

zpool export rpool して、CDを抜いてリブートすると何の問題もなく起動してきた。

ただ、起動した後に再度scrubすると大量の修復が走ってる。
やっぱりUSBメモリがそろそろ寿命っぽい。

root@sol10-u24 21:06:14>zpool status
  プール: rpool
状態: ONLINE
状態: 1 つまたは複数のデバイスで回復不可能なエラーが発生しました。
        エラーの修正が試行されました。アプリケーションへの影響はありません。
アクション: デバイスの置換が必要かどうかを判断し、'zpool clear' を使用してエラーを消去するか、
        'zpool replace' を使用してデバイスを置換してください。
次のサイトを参照してください: http://www.sun.com/msg/ZFS-8000-9P
スクラブ: Mon Jan 10 21:06:16 2011
上で 0 エラーが発生した 0h14m のあとの scrub completed構成:

        NAME          STATE     READ WRITE CKSUM
        rpool         ONLINE       0     0     0
          mirror      ONLINE       0     0     0
            c0t0d0s0  ONLINE       0     0 1.63K  36.7M repaired
            c1t0d0s0  ONLINE       0     0     2  320K repaired

運用一年でこんなになるとは、次はちゃんとHDDにインストールしよう。

0 件のコメント:

コメントを投稿