dolfi56
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
Hallo,
ich erhielt von meinem Ubuntu-Server vorhin folgende E-Mail:
This is an automatically generated mail message from mdadm running on server
A Fail event had been detected on md device /dev/md/0.
It could be related to component device /dev/sda1.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sda1[0](F) sdb1[1]
732438208 blocks super 1.2 [2/1] [_U]
md127 : active raid1 sdd1[1] sdc1[0]
976622080 blocks super 1.2 [2/2] [UU]
unused devices: <none>
Im Mailbetreff stand: Fail event on /dev/md/0:matthias-nas
Muss ich besorgt sein? Was wären die nächsten Schritte??
|
Lookbehind
Anmeldungsdatum: 28. Januar 2010
Beiträge: 1070
|
Sorgen nicht unbedingt, sda scheint wohl kaputt zu sein. Erst mal kein großes Problem, dafür ist das RAID ja da. Aber du solltest sda austauschen und die neue Platte dem RAID wieder hinzufügen. Siehe dazu auch Software-RAID (Abschnitt „Festplattenausfall“)
|
frostschutz
Anmeldungsdatum: 18. November 2010
Beiträge: 7657
|
Rausfinden wieso sda1 aus dem RAID gefallen ist. smartctl -a /dev/sda
smartctl -a /dev/sdb
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
Kann kaum glauben, das die defekt sein soll.
SDA:
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 150
2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0
3 Spin_Up_Time 0x0023 089 089 025 Pre-fail Always - 3464
4 Start_Stop_Count 0x0032 097 097 000 Old_age Always - 3034
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 2886
10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 351
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 689
181 Program_Fail_Cnt_Total 0x0022 100 100 000 Old_age Always - 19099830
191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 663
192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0
194 Temperature_Celsius 0x0002 064 059 000 Old_age Always - 33 (Min/Max 13/42)
195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 3
200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 1325
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 351
225 Load_Cycle_Count 0x0032 093 093 000 Old_age Always - 74893
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 2616 - SDB:
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 14
2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0
3 Spin_Up_Time 0x0023 089 089 025 Pre-fail Always - 3451
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 879
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 3347
10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 33
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 695
181 Program_Fail_Cnt_Total 0x0022 099 099 000 Old_age Always - 32401109
191 G-Sense_Error_Rate 0x0022 098 098 000 Old_age Always - 28325
192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0
194 Temperature_Celsius 0x0002 064 061 000 Old_age Always - 32 (Min/Max 12/41)
195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 7
200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 1005
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 33
225 Load_Cycle_Count 0x0032 093 093 000 Old_age Always - 75666
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 3077 -
# 2 Extended offline Aborted by host 90% 3077 - Ich kann nicht erkennen, dass da irgendein Fehler passeirt ist ...
|
frostschutz
Anmeldungsdatum: 18. November 2010
Beiträge: 7657
|
Wenn du meinst daß die Platte OK ist, dann mach eben einen --re-add. Gibts ein Syslog, vielleicht steht da drin was passiert ist. Den ungefähren Zeitpunkt hast du ja von der Mail. Der Load Cycle Count ist ziemlich hoch, sind das WD Greens?
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
frostschutz schrieb: Wenn du meinst daß die Platte OK ist, dann mach eben einen --re-add. Gibts ein Syslog, vielleicht steht da drin was passiert ist. Den ungefähren Zeitpunkt hast du ja von der Mail. Der Load Cycle Count ist ziemlich hoch, sind das WD Greens?
das müssten als NAS missbrauchte Samsung Notebook Festplatten sein. Das System lief vorher als Windows-Server und seit gut 5 bis 8 Wochen auf Ubuntu.
Im Syslog:
Jul 25 20:55:15 server kernel: [ 362.808070] ata1.00: exception Emask 0x0 SAct 0x7ffff000 SErr 0x0 action 0x6 frozen
Jul 25 20:55:15 server kernel: [ 362.808219] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.808321] ata1.00: cmd 61/00:60:00:b4:21/04:00:17:00:00/40 tag 12 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.808321] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.808568] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.808637] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.808736] ata1.00: cmd 61/00:68:00:b8:21/04:00:17:00:00/40 tag 13 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.808736] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.808982] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.809050] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.809149] ata1.00: cmd 61/00:70:00:bc:21/04:00:17:00:00/40 tag 14 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.809149] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.809395] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.809463] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.809562] ata1.00: cmd 61/00:78:00:c0:21/04:00:17:00:00/40 tag 15 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.809562] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.809808] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.809876] ata1.00: failed command: READ FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.809974] ata1.00: cmd 60/08:80:00:08:44/00:00:17:00:00/40 tag 16 ncq 4096 in
Jul 25 20:55:15 server kernel: [ 362.809974] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.810216] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.810284] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.810383] ata1.00: cmd 61/00:88:00:c4:21/04:00:17:00:00/40 tag 17 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.810383] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.810629] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.810697] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.810796] ata1.00: cmd 61/00:90:00:c8:21/04:00:17:00:00/40 tag 18 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.810796] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.811042] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.811110] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.811208] ata1.00: cmd 61/00:98:00:cc:21/04:00:17:00:00/40 tag 19 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.811208] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.811455] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.811523] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.811621] ata1.00: cmd 61/00:a0:00:d0:21/04:00:17:00:00/40 tag 20 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.811621] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.811867] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.811935] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.812094] ata1.00: cmd 61/00:a8:00:d4:21/04:00:17:00:00/40 tag 21 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.812094] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.812354] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.812424] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.812525] ata1.00: cmd 61/00:b0:00:d8:21/04:00:17:00:00/40 tag 22 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.812525] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.812773] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.812842] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.812942] ata1.00: cmd 61/00:b8:00:dc:21/04:00:17:00:00/40 tag 23 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.812942] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.813187] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.813256] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.813354] ata1.00: cmd 61/00:c0:00:e0:21/04:00:17:00:00/40 tag 24 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.813354] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.813600] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.818042] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.822518] ata1.00: cmd 61/00:c8:00:e4:21/04:00:17:00:00/40 tag 25 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.822518] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.831514] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.835915] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.840299] ata1.00: cmd 61/00:d0:00:e8:21/04:00:17:00:00/40 tag 26 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.840299] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.849093] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.853480] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.857865] ata1.00: cmd 61/00:d8:00:ec:21/04:00:17:00:00/40 tag 27 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.857865] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.866667] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.871056] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.875448] ata1.00: cmd 61/00:e0:00:f0:21/04:00:17:00:00/40 tag 28 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.875448] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.884259] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.888654] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.893048] ata1.00: cmd 61/00:e8:00:f4:21/04:00:17:00:00/40 tag 29 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.893048] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.901874] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.906281] ata1.00: failed command: WRITE FPDMA QUEUED
Jul 25 20:55:15 server kernel: [ 362.910688] ata1.00: cmd 61/00:f0:00:f8:21/04:00:17:00:00/40 tag 30 ncq 524288 out
Jul 25 20:55:15 server kernel: [ 362.910688] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Jul 25 20:55:15 server kernel: [ 362.919550] ata1.00: status: { DRDY }
Jul 25 20:55:15 server kernel: [ 362.923971] ata1: hard resetting link
Jul 25 20:55:20 server kernel: [ 368.280037] ata1: link is slow to respond, please be patient (ready=0)
Jul 25 20:55:24 server kernel: [ 372.648056] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jul 25 20:55:24 server kernel: [ 372.660671] ata1.00: configured for UDMA/133
Jul 25 20:55:24 server kernel: [ 372.660683] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660690] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660696] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660701] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660706] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660711] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660716] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660722] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660727] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660732] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660737] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660742] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660747] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660752] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660757] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660762] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660767] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660772] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660777] ata1.00: device reported invalid CHS sector 0
Jul 25 20:55:24 server kernel: [ 372.660798] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.660804] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.660808] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.660813] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.660816] Write(10): 2a 00 17 21 84 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.660833] end_request: I/O error, dev sda, sector 388072448
Jul 25 20:55:24 server kernel: [ 372.665334] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.665349] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.665363] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.665377] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.665390] Write(10): 2a 00 17 21 88 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.665411] end_request: I/O error, dev sda, sector 388073472
Jul 25 20:55:24 server kernel: [ 372.666040] md/raid1:md0: Disk failure on sda1, disabling device.
Jul 25 20:55:24 server kernel: [ 372.666040] md/raid1:md0: Operation continuing on 1 devices.
Jul 25 20:55:24 server kernel: [ 372.678765] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.678774] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.678779] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.678787] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.678792] Write(10): 2a 00 17 21 8c 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.678814] end_request: I/O error, dev sda, sector 388074496
Jul 25 20:55:24 server kernel: [ 372.683510] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.683517] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.683521] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.683526] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.683529] Write(10): 2a 00 17 21 90 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.683545] end_request: I/O error, dev sda, sector 388075520
Jul 25 20:55:24 server kernel: [ 372.687883] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.687890] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.687894] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.687900] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.687904] Write(10): 2a 00 17 21 94 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.687925] end_request: I/O error, dev sda, sector 388076544
Jul 25 20:55:24 server kernel: [ 372.692582] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.692589] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.692594] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.692598] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.692601] Write(10): 2a 00 17 21 98 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.692618] end_request: I/O error, dev sda, sector 388077568
Jul 25 20:55:24 server kernel: [ 372.696831] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.696838] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.696843] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.696849] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.696853] Write(10): 2a 00 17 21 9c 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.696875] end_request: I/O error, dev sda, sector 388078592
Jul 25 20:55:24 server kernel: [ 372.701401] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.701408] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.701412] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.701417] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.701420] Write(10): 2a 00 17 21 a0 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.701436] end_request: I/O error, dev sda, sector 388079616
Jul 25 20:55:24 server kernel: [ 372.705519] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.705526] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.705530] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.705537] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.705541] Write(10): 2a 00 17 21 a4 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.705563] end_request: I/O error, dev sda, sector 388080640
Jul 25 20:55:24 server kernel: [ 372.710427] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.710439] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.710445] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.710452] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.710457] Write(10): 2a 00 17 21 a8 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.710481] end_request: I/O error, dev sda, sector 388081664
Jul 25 20:55:24 server kernel: [ 372.714533] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.714542] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.714547] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.714553] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.714558] Write(10): 2a 00 17 21 ac 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.714599] sd 0:0:0:0: [sda] Unhandled error code
Jul 25 20:55:24 server kernel: [ 372.714607] sd 0:0:0:0: [sda]
Jul 25 20:55:24 server kernel: [ 372.714611] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Jul 25 20:55:24 server kernel: [ 372.714618] sd 0:0:0:0: [sda] CDB:
Jul 25 20:55:24 server kernel: [ 372.714633] Write(10): 2a 00 17 21 b0 00 00 04 00 00
Jul 25 20:55:24 server kernel: [ 372.714722] ata1: EH complete
Jul 25 20:55:25 server mdadm[1414]: Fail event detected on md device /dev/md/0, component device /dev/sda1
MAIL über POSTFIX verschickt
Jul 25 20:55:42 server kernel: [ 390.268246] RAID1 conf printout:
Jul 25 20:55:42 server kernel: [ 390.268256] --- wd:1 rd:2
Jul 25 20:55:42 server kernel: [ 390.268263] disk 0, wo:1, o:0, dev:sda1
Jul 25 20:55:42 server kernel: [ 390.268268] disk 1, wo:0, o:1, dev:sdb1
Jul 25 20:55:42 server kernel: [ 390.280139] RAID1 conf printout:
Jul 25 20:55:42 server kernel: [ 390.280150] --- wd:1 rd:2
Jul 25 20:55:42 server kernel: [ 390.280158] disk 1, wo:0, o:1, dev:sdb1
Jul 25 21:09:01 server CRON[1760]: (root) CMD ( [ -x /usr/lib/php5/maxlifetime ] && [ -x /usr/lib/php5/sessionclean ] && [ -d /var/lib/php5 ] && /usr/lib/php5/sessionclean /var/lib/php5 $(/usr/lib/php5/maxlifetime))
Jul 25 21:17:01 server CRON[1787]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Jul 25 21:22:49 server kernel: [ 2017.118172] perf samples too long (2524 > 2500), lowering kernel.perf_event_max_sample_rate to 50000 Gibt es bzgl. der LoadCyclie irgendwo nen Tutorial? Das wollte ich noch konfigurieren, ebenso wie ein gescheites Hardware-Monitoring.
|
frostschutz
Anmeldungsdatum: 18. November 2010
Beiträge: 7657
|
Hm, das klingt doch ziemlich schlecht für sda. Kann natürlich auch am Kabel liegen, aber... Lass trotzdem mal smartctl -t long auf sda und sdb. Edit: Ganz ähnliches Fehlerbild, da hat ein Kabelwechsel geholfen: http://forum.ubuntuusers.de/topic/sata-verbindung-friert-bei-last-ein/
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
frostschutz schrieb: Hm, das klingt doch ziemlich schlecht für sda. Kann natürlich auch am Kabel liegen, aber... Lass trotzdem mal smartctl -t long auf sda und sdb. Edit: Ganz ähnliches Fehlerbild, da hat ein Kabelwechsel geholfen: http://forum.ubuntuusers.de/topic/sata-verbindung-friert-bei-last-ein/
ok, das mache ich gleich noch mal. ich lasse gerade das entsprechende Diagnosetool von der UBCD durchlaufen ... ist zwar ein NAS, Monitor und Tastatur sind aber für den Fall der Fälle angeschlossen ☺
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
es wurden keine Fehler gefunden. Muss ich vor dem --re-add ein "mdadm --stop /dev/md0 " durchführen? Da meckert der und sagt mir immer
mdadm: Cannot get exclusive access to /dev/md0:Perhaps a running process, mounted filesystem or active volume group?
Kann ich nun einfach den --re-add machen??? oder was muss ich tun? mounts aufheben??
|
frostschutz
Anmeldungsdatum: 18. November 2010
Beiträge: 7657
|
Ja, einfach --re-add machen oder wenn das nicht geht, auch normalen --add. Kein --stop, einem gestoppten RAID kannst du nichts hinzufügen.
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
ok, der scheint sich nun zu syncen. hoffentlich macht der mir nichts falsch und löscht alle daten ...
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
frostschutz schrieb: Ja, einfach --re-add machen oder wenn das nicht geht, auch normalen --add. Kein --stop, einem gestoppten RAID kannst du nichts hinzufügen.
so, ist nun fertig, ein --re-add klappte nicht, nur ein --add. warum auch immer ...
mich wundert nur, das bei sda1 eine 2 und sdb1 eine 1 steht. und bei dem md127 eine 0 und 1, muss man das verstehen?
md127 : active raid1 sdd1[0] sde1[1]
976622080 blocks super 1.2 [2/2] [UU]
md0 : active raid1 sda1[2] sdb1[1]
732438208 blocks super 1.2 [2/2] [UU]
|
frostschutz
Anmeldungsdatum: 18. November 2010
Beiträge: 7657
|
Nein. Diese Nummern sind Zufall, was halt gerade frei ist.
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
frostschutz schrieb: Nein. Diese Nummern sind Zufall, was halt gerade frei ist.
ok, danke. Damit ist das alles hier erst mal gelöst. Den Tipp mit dem Kabeltausch werde ich mir mal merken und so bald es wieder vorkommt, sofort durchführen.
|
dolfi56
(Themenstarter)
Anmeldungsdatum: 13. Mai 2014
Beiträge: 132
|
frostschutz schrieb: Nein. Diese Nummern sind Zufall, was halt gerade frei ist.
argh, schon wieder ist es passiert, mit der selben Platte ... habe nun das Kabel getauscht und einen "smartctl -t long" durchlaufen lassen. Es wurde kein Fehler festgestellt und hab es wieder zum Array hinzugefügt ... wenn das nun alle 4 Wochen vor kommt ....
|