Seagate Barracuda 7200.11のファームウェア問題 [PC(ハードウェア)]
Atom330なマシンにSATAカード増設してSATAポートマルチプライアを経由してSeagate Barracuda 7200.11の1.5GBなディスク(ST31500341AS)を接続、ソフトRAIDしているのだけども…
Memoroのメモ帳(memoro様)のblogに記述のある条件とか現象とか直球ストライクゾーンど真ん中な我が家のHDD…。
どうも、Vista(32bit)なPCでDVDを見ると、不意にデータがやってこなくなる現象にぶちあたる。XPなマシンだと現象でないぽい。よくわからんのですが。
では、CentOSなマシンからこれらの現象がどう見えるのかというと…
まずは /proc/scsi/scsi を見るとこんな具合。
BIOSのバージョンが「Rev:」のところで見えますが、ここに思いっきり「SD18」と。
うはwwwおkwww思いっきり病んでるファームキター
そして、突然死した瞬間、こんなメッセージが出る。長いけどべったりログをべったり貼り付ける。
① ディスク読み込み失敗
② 例外処理発生
③ SATAデバイスリセット(SATAリンクダウン→SATAリンクアップ)
④ SATA初期化
⑤ HDD再認識
とかこんな具合の処理を繰り返して復旧するようです。また、このメッセージ自体はHDDへのアクセスに失敗してからおよそ30秒くらいしてからどどっと流れだし、このメッセージが出た後まもなくアクセスが復旧するという感じです。
ちなみに、ソフトRAIDしてますが、RAIDのリビルドは走らないみたいです。
念のためfsckしてみても特に問題はなさそう。
ただ気持ちが悪いのであとでSeagateが配布している新ファームを試す方向。
で、Seagateが配布している新ファーム(SD1B)にアップしてみた。
新ファームへのアップデートプログラムはCDRのイメージファイル形式になっているので、これを入手しCDRに焼き込む必要がある。アップデートプログラムはFreeDOSでブートするようになっている。メジャーなSATAコントローラは概ね自動認識するようになっていた。
起動すると、英文のドキュメントが表示されるが日本語でないので何のことかさっぱり判らないからF10を押してアップデートプログラム本体へと進む。
Aキーでファームのアップデート、SキーでHDDのスキャン、Zキーでプログラム終了となっている。
Aキーでファームをアップデートするのにかかる時間は1分弱といったところで、更新が終わると英文でCtrl + Alt + Deleteキーは押すな!電源を切れ!と警告されるのでこれに従う。おそらく、ほとんどのマザーならアップデートが終わった後で何かのキーを押すと電源が自動で切れるはずだ。
アップデート後、ストレージサーバに組み込んで状態を見てみるとこんな感じ。
「Rev:」のところがSD18からSD1Bに変わっていることが確認できる。
念のためfsck等を実行してみたが異常なく、RAID5のアレイも正常な状態が保たれていた。
samba経由で動画ファイルを再生したがこれまで頻発していたような、30秒くらいデータ転送が停止する(そしてメッセージがどどーっと流れる)ような現象は発生しなくなった。
これでまずは一安心…といったところだろうか。
Memoroのメモ帳(memoro様)のblogに記述のある条件とか現象とか直球ストライクゾーンど真ん中な我が家のHDD…。
どうも、Vista(32bit)なPCでDVDを見ると、不意にデータがやってこなくなる現象にぶちあたる。XPなマシンだと現象でないぽい。よくわからんのですが。
では、CentOSなマシンからこれらの現象がどう見えるのかというと…
まずは /proc/scsi/scsi を見るとこんな具合。
[root@chihiro scsi]# cat scsi Attached devices: Host: scsi0 Channel: 00 Id: 00 Lun: 00 Vendor: ATA Model: TOSHIBA MK1032GS Rev: AS02 Type: Direct-Access ANSI SCSI revision: 05 Host: scsi2 Channel: 00 Id: 00 Lun: 00 Vendor: ATA Model: WDC WD5000AAKS-2 Rev: 01.0 Type: Direct-Access ANSI SCSI revision: 05 Host: scsi2 Channel: 01 Id: 00 Lun: 00 Vendor: ATA Model: Hitachi HDT72505 Rev: V56O Type: Direct-Access ANSI SCSI revision: 05 Host: scsi2 Channel: 02 Id: 00 Lun: 00 Vendor: ATA Model: Hitachi HDT72505 Rev: V56O Type: Direct-Access ANSI SCSI revision: 05 Host: scsi2 Channel: 03 Id: 00 Lun: 00 Vendor: ATA Model: Hitachi HDT72505 Rev: V56O Type: Direct-Access ANSI SCSI revision: 05 Host: scsi3 Channel: 00 Id: 00 Lun: 00 Vendor: ATA Model: ST31500341AS Rev: SD18 Type: Direct-Access ANSI SCSI revision: 05 Host: scsi3 Channel: 01 Id: 00 Lun: 00 Vendor: ATA Model: ST31500341AS Rev: SD18 Type: Direct-Access ANSI SCSI revision: 05 Host: scsi3 Channel: 02 Id: 00 Lun: 00 Vendor: ATA Model: ST31500341AS Rev: SD18 Type: Direct-Access ANSI SCSI revision: 05 Host: scsi3 Channel: 03 Id: 00 Lun: 00 Vendor: ATA Model: ST31500341AS Rev: SD18 Type: Direct-Access ANSI SCSI revision: 05 Host: scsi3 Channel: 04 Id: 00 Lun: 00 Vendor: ATA Model: ST31500341AS Rev: SD18 Type: Direct-Access ANSI SCSI revision: 05 Host: scsi4 Channel: 00 Id: 00 Lun: 00 Vendor: ATA Model: ST31500341AS Rev: SD18 Type: Direct-Access ANSI SCSI revision: 05
BIOSのバージョンが「Rev:」のところで見えますが、ここに思いっきり「SD18」と。
うはwwwおkwww思いっきり病んでるファームキター
そして、突然死した瞬間、こんなメッセージが出る。長いけどべったりログをべったり貼り付ける。
Feb 12 23:40:36 chihiro kernel: ata5.00: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata5.01: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata5.02: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata5.03: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata5.04: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata5.05: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata5.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata5.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 0 Feb 12 23:40:36 chihiro kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Feb 12 23:40:36 chihiro kernel: ata4.00: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata4.01: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata4.02: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata4.03: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata4.04: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata4.05: failed to read SCR 1 (Emask=0x40) Feb 12 23:40:36 chihiro kernel: ata4.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata4.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 0 Feb 12 23:40:36 chihiro kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Feb 12 23:40:36 chihiro kernel: ata4.00: status: { DRDY } Feb 12 23:40:36 chihiro kernel: ata4.01: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata4.01: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 4 Feb 12 23:40:36 chihiro kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Feb 12 23:40:36 chihiro kernel: ata4.01: status: { DRDY } Feb 12 23:40:36 chihiro kernel: ata4.02: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata4.02: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 3 Feb 12 23:40:36 chihiro kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Feb 12 23:40:36 chihiro kernel: ata4.02: status: { DRDY } Feb 12 23:40:36 chihiro kernel: ata4.03: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata4.03: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 2 Feb 12 23:40:36 chihiro kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Feb 12 23:40:36 chihiro kernel: ata4.03: status: { DRDY } Feb 12 23:40:36 chihiro kernel: ata4.04: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata4.04: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 1 Feb 12 23:40:36 chihiro kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Feb 12 23:40:36 chihiro kernel: ata4.04: status: { DRDY } Feb 12 23:40:36 chihiro kernel: ata4.05: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata4.15: hard resetting link Feb 12 23:40:36 chihiro kernel: ata5.00: status: { DRDY } Feb 12 23:40:36 chihiro kernel: ata5.01: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata5.02: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata5.03: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata5.04: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata5.05: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen Feb 12 23:40:36 chihiro kernel: ata5.15: hard resetting link Feb 12 23:40:38 chihiro kernel: ata4.15: SATA link up 3.0 Gbps (SStatus 123 SControl 0) Feb 12 23:40:38 chihiro kernel: ata4.00: hard resetting link Feb 12 23:40:38 chihiro kernel: ata5.15: SATA link up 3.0 Gbps (SStatus 123 SControl 0) Feb 12 23:40:38 chihiro kernel: ata5.00: hard resetting link Feb 12 23:40:38 chihiro kernel: ata4.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320) Feb 12 23:40:38 chihiro kernel: ata4.01: hard resetting link Feb 12 23:40:38 chihiro kernel: ata5.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320) Feb 12 23:40:38 chihiro kernel: ata5.01: hard resetting link Feb 12 23:40:39 chihiro kernel: ata5.01: SATA link down (SStatus 0 SControl 320) Feb 12 23:40:39 chihiro kernel: ata5.02: hard resetting link Feb 12 23:40:39 chihiro kernel: ata4.01: SATA link up 1.5 Gbps (SStatus 113 SControl 310) Feb 12 23:40:39 chihiro kernel: ata4.02: hard resetting link Feb 12 23:40:39 chihiro kernel: ata5.02: SATA link down (SStatus 0 SControl 320) Feb 12 23:40:39 chihiro kernel: ata5.03: hard resetting link Feb 12 23:40:39 chihiro kernel: ata4.02: SATA link up 1.5 Gbps (SStatus 113 SControl 310) Feb 12 23:40:39 chihiro kernel: ata4.03: hard resetting link Feb 12 23:40:39 chihiro kernel: ata5.03: SATA link down (SStatus 0 SControl 320) Feb 12 23:40:39 chihiro kernel: ata5.04: hard resetting link Feb 12 23:40:39 chihiro kernel: ata4.03: SATA link up 3.0 Gbps (SStatus 123 SControl 320) Feb 12 23:40:39 chihiro kernel: ata4.04: hard resetting link Feb 12 23:40:40 chihiro kernel: ata5.04: SATA link down (SStatus 0 SControl 320) Feb 12 23:40:40 chihiro kernel: ata5.05: hard resetting link Feb 12 23:40:40 chihiro kernel: ata4.04: SATA link up 1.5 Gbps (SStatus 113 SControl 310) Feb 12 23:40:40 chihiro kernel: ata4.05: hard resetting link Feb 12 23:40:40 chihiro kernel: ata5.05: SATA link up 1.5 Gbps (SStatus 113 SControl 320) Feb 12 23:40:40 chihiro kernel: ata5.00: configured for UDMA/100 Feb 12 23:40:40 chihiro kernel: ata5: EH complete Feb 12 23:40:40 chihiro kernel: SCSI device sdk: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdk: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdk: drive cache: write back Feb 12 23:40:40 chihiro kernel: ata4.05: SATA link up 1.5 Gbps (SStatus 113 SControl 320) Feb 12 23:40:40 chihiro kernel: ata4.00: configured for UDMA/100 Feb 12 23:40:40 chihiro kernel: ata4.01: configured for UDMA/100 Feb 12 23:40:40 chihiro kernel: ata4.02: configured for UDMA/100 Feb 12 23:40:40 chihiro kernel: ata4.03: configured for UDMA/100 Feb 12 23:40:40 chihiro kernel: ata4.04: configured for UDMA/100 Feb 12 23:40:40 chihiro kernel: ata4: EH complete Feb 12 23:40:40 chihiro kernel: SCSI device sdf: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdf: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdf: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdg: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdg: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdg: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdh: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdh: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdh: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdi: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdi: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdi: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdj: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdj: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdj: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdf: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdf: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdf: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdg: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdg: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdg: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdh: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdh: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdh: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdi: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdi: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdi: drive cache: write back Feb 12 23:40:40 chihiro kernel: SCSI device sdj: 2930277168 512-byte hdwr sectors (1500302 MB) Feb 12 23:40:40 chihiro kernel: sdj: Write Protect is off Feb 12 23:40:40 chihiro kernel: SCSI device sdj: drive cache: write back
① ディスク読み込み失敗
② 例外処理発生
③ SATAデバイスリセット(SATAリンクダウン→SATAリンクアップ)
④ SATA初期化
⑤ HDD再認識
とかこんな具合の処理を繰り返して復旧するようです。また、このメッセージ自体はHDDへのアクセスに失敗してからおよそ30秒くらいしてからどどっと流れだし、このメッセージが出た後まもなくアクセスが復旧するという感じです。
ちなみに、ソフトRAIDしてますが、RAIDのリビルドは走らないみたいです。
[root@chihiro ~]# cat /proc/mdstat Personalities : [raid6] [raid5] [raid4] md1 : active raid5 sdf[0] sdk[5] sdj[4] sdi[3] sdh[2] sdg[1] 7325692480 blocks level 5, 64k chunk, algorithm 2 [6/6] [UUUUUU]
念のためfsckしてみても特に問題はなさそう。
ただ気持ちが悪いのであとでSeagateが配布している新ファームを試す方向。
で、Seagateが配布している新ファーム(SD1B)にアップしてみた。
新ファームへのアップデートプログラムはCDRのイメージファイル形式になっているので、これを入手しCDRに焼き込む必要がある。アップデートプログラムはFreeDOSでブートするようになっている。メジャーなSATAコントローラは概ね自動認識するようになっていた。
起動すると、英文のドキュメントが表示されるが日本語でないので何のことかさっぱり判らないからF10を押してアップデートプログラム本体へと進む。
Aキーでファームのアップデート、SキーでHDDのスキャン、Zキーでプログラム終了となっている。
Aキーでファームをアップデートするのにかかる時間は1分弱といったところで、更新が終わると英文でCtrl + Alt + Deleteキーは押すな!電源を切れ!と警告されるのでこれに従う。おそらく、ほとんどのマザーならアップデートが終わった後で何かのキーを押すと電源が自動で切れるはずだ。
アップデート後、ストレージサーバに組み込んで状態を見てみるとこんな感じ。
Host: scsi3 Channel: 00 Id: 00 Lun: 00 Vendor: ATA Model: ST31500341AS Rev: SD1B Type: Direct-Access ANSI SCSI revision: 05
「Rev:」のところがSD18からSD1Bに変わっていることが確認できる。
念のためfsck等を実行してみたが異常なく、RAID5のアレイも正常な状態が保たれていた。
samba経由で動画ファイルを再生したがこれまで頻発していたような、30秒くらいデータ転送が停止する(そしてメッセージがどどーっと流れる)ような現象は発生しなくなった。
これでまずは一安心…といったところだろうか。
コメント 0