Fehlermeldung Software-RAID › Serverdienste und Dateifreigaben im Netzwerk › Fortgeschrittene Themen › Forum › ubuntuusers.de

Fehlermeldung Software-RAID

« Vorherige1Nächste »

Status: Gelöst | Ubuntu-Version: Server 14.04 (Trusty Tahr)
Antworten |

dolfi56 Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 25. Juli 2014 21:08 Hallo, ich erhielt von meinem Ubuntu-Server vorhin folgende E-Mail: This is an automatically generated mail message from mdadm running on server A Fail event had been detected on md device /dev/md/0. It could be related to component device /dev/sda1. Faithfully yours, etc. P.S. The /proc/mdstat file currently contains the following: Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : active raid1 sda1[0](F) sdb1[1] 732438208 blocks super 1.2 [2/1] [_U] md127 : active raid1 sdd1[1] sdc1[0] 976622080 blocks super 1.2 [2/2] [UU] unused devices: <none> Im Mailbetreff stand: Fail event on /dev/md/0:matthias-nas Muss ich besorgt sein? Was wären die nächsten Schritte??
Lookbehind Anmeldungsdatum: 28. Januar 2010 Beiträge: 1070	Zitieren 25. Juli 2014 21:16 Sorgen nicht unbedingt, sda scheint wohl kaputt zu sein. Erst mal kein großes Problem, dafür ist das RAID ja da. Aber du solltest sda austauschen und die neue Platte dem RAID wieder hinzufügen. Siehe dazu auch Software-RAID (Abschnitt „Festplattenausfall“)
frostschutz Anmeldungsdatum: 18. November 2010 Beiträge: 7657	Zitieren 25. Juli 2014 21:25 Rausfinden wieso sda1 aus dem RAID gefallen ist. smartctl -a /dev/sda smartctl -a /dev/sdb
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 25. Juli 2014 21:34 Kann kaum glauben, das die defekt sein soll. SDA: Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 150 2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0 3 Spin_Up_Time 0x0023 089 089 025 Pre-fail Always - 3464 4 Start_Stop_Count 0x0032 097 097 000 Old_age Always - 3034 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 2886 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 351 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 689 181 Program_Fail_Cnt_Total 0x0022 100 100 000 Old_age Always - 19099830 191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 663 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 059 000 Old_age Always - 33 (Min/Max 13/42) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 3 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 1325 223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 351 225 Load_Cycle_Count 0x0032 093 093 000 Old_age Always - 74893 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 2616 - SDB: Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 14 2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0 3 Spin_Up_Time 0x0023 089 089 025 Pre-fail Always - 3451 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 879 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 3347 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 33 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 695 181 Program_Fail_Cnt_Total 0x0022 099 099 000 Old_age Always - 32401109 191 G-Sense_Error_Rate 0x0022 098 098 000 Old_age Always - 28325 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 061 000 Old_age Always - 32 (Min/Max 12/41) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 7 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 1005 223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 33 225 Load_Cycle_Count 0x0032 093 093 000 Old_age Always - 75666 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 3077 - # 2 Extended offline Aborted by host 90% 3077 - Ich kann nicht erkennen, dass da irgendein Fehler passeirt ist ...
frostschutz Anmeldungsdatum: 18. November 2010 Beiträge: 7657	Zitieren 25. Juli 2014 21:39 (zuletzt bearbeitet: 25. Juli 2014 21:40) Wenn du meinst daß die Platte OK ist, dann mach eben einen --re-add. Gibts ein Syslog, vielleicht steht da drin was passiert ist. Den ungefähren Zeitpunkt hast du ja von der Mail. Der Load Cycle Count ist ziemlich hoch, sind das WD Greens?
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 25. Juli 2014 21:43 (zuletzt bearbeitet: 25. Juli 2014 21:50) frostschutz schrieb: Wenn du meinst daß die Platte OK ist, dann mach eben einen --re-add. Gibts ein Syslog, vielleicht steht da drin was passiert ist. Den ungefähren Zeitpunkt hast du ja von der Mail. Der Load Cycle Count ist ziemlich hoch, sind das WD Greens? das müssten als NAS missbrauchte Samsung Notebook Festplatten sein. Das System lief vorher als Windows-Server und seit gut 5 bis 8 Wochen auf Ubuntu. Im Syslog: Jul 25 20:55:15 server kernel: [ 362.808070] ata1.00: exception Emask 0x0 SAct 0x7ffff000 SErr 0x0 action 0x6 frozen Jul 25 20:55:15 server kernel: [ 362.808219] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.808321] ata1.00: cmd 61/00:60:00:b4:21/04:00:17:00:00/40 tag 12 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.808321] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.808568] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.808637] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.808736] ata1.00: cmd 61/00:68:00:b8:21/04:00:17:00:00/40 tag 13 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.808736] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.808982] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.809050] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.809149] ata1.00: cmd 61/00:70:00:bc:21/04:00:17:00:00/40 tag 14 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.809149] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.809395] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.809463] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.809562] ata1.00: cmd 61/00:78:00:c0:21/04:00:17:00:00/40 tag 15 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.809562] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.809808] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.809876] ata1.00: failed command: READ FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.809974] ata1.00: cmd 60/08:80:00:08:44/00:00:17:00:00/40 tag 16 ncq 4096 in Jul 25 20:55:15 server kernel: [ 362.809974] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.810216] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.810284] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.810383] ata1.00: cmd 61/00:88:00:c4:21/04:00:17:00:00/40 tag 17 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.810383] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.810629] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.810697] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.810796] ata1.00: cmd 61/00:90:00:c8:21/04:00:17:00:00/40 tag 18 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.810796] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.811042] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.811110] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.811208] ata1.00: cmd 61/00:98:00:cc:21/04:00:17:00:00/40 tag 19 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.811208] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.811455] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.811523] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.811621] ata1.00: cmd 61/00:a0:00:d0:21/04:00:17:00:00/40 tag 20 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.811621] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.811867] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.811935] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.812094] ata1.00: cmd 61/00:a8:00:d4:21/04:00:17:00:00/40 tag 21 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.812094] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.812354] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.812424] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.812525] ata1.00: cmd 61/00:b0:00:d8:21/04:00:17:00:00/40 tag 22 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.812525] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.812773] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.812842] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.812942] ata1.00: cmd 61/00:b8:00:dc:21/04:00:17:00:00/40 tag 23 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.812942] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.813187] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.813256] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.813354] ata1.00: cmd 61/00:c0:00:e0:21/04:00:17:00:00/40 tag 24 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.813354] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.813600] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.818042] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.822518] ata1.00: cmd 61/00:c8:00:e4:21/04:00:17:00:00/40 tag 25 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.822518] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.831514] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.835915] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.840299] ata1.00: cmd 61/00:d0:00:e8:21/04:00:17:00:00/40 tag 26 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.840299] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.849093] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.853480] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.857865] ata1.00: cmd 61/00:d8:00:ec:21/04:00:17:00:00/40 tag 27 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.857865] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.866667] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.871056] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.875448] ata1.00: cmd 61/00:e0:00:f0:21/04:00:17:00:00/40 tag 28 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.875448] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.884259] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.888654] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.893048] ata1.00: cmd 61/00:e8:00:f4:21/04:00:17:00:00/40 tag 29 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.893048] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.901874] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.906281] ata1.00: failed command: WRITE FPDMA QUEUED Jul 25 20:55:15 server kernel: [ 362.910688] ata1.00: cmd 61/00:f0:00:f8:21/04:00:17:00:00/40 tag 30 ncq 524288 out Jul 25 20:55:15 server kernel: [ 362.910688] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Jul 25 20:55:15 server kernel: [ 362.919550] ata1.00: status: { DRDY } Jul 25 20:55:15 server kernel: [ 362.923971] ata1: hard resetting link Jul 25 20:55:20 server kernel: [ 368.280037] ata1: link is slow to respond, please be patient (ready=0) Jul 25 20:55:24 server kernel: [ 372.648056] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300) Jul 25 20:55:24 server kernel: [ 372.660671] ata1.00: configured for UDMA/133 Jul 25 20:55:24 server kernel: [ 372.660683] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660690] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660696] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660701] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660706] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660711] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660716] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660722] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660727] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660732] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660737] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660742] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660747] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660752] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660757] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660762] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660767] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660772] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660777] ata1.00: device reported invalid CHS sector 0 Jul 25 20:55:24 server kernel: [ 372.660798] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.660804] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.660808] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.660813] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.660816] Write(10): 2a 00 17 21 84 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.660833] end_request: I/O error, dev sda, sector 388072448 Jul 25 20:55:24 server kernel: [ 372.665334] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.665349] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.665363] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.665377] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.665390] Write(10): 2a 00 17 21 88 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.665411] end_request: I/O error, dev sda, sector 388073472 Jul 25 20:55:24 server kernel: [ 372.666040] md/raid1:md0: Disk failure on sda1, disabling device. Jul 25 20:55:24 server kernel: [ 372.666040] md/raid1:md0: Operation continuing on 1 devices. Jul 25 20:55:24 server kernel: [ 372.678765] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.678774] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.678779] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.678787] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.678792] Write(10): 2a 00 17 21 8c 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.678814] end_request: I/O error, dev sda, sector 388074496 Jul 25 20:55:24 server kernel: [ 372.683510] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.683517] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.683521] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.683526] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.683529] Write(10): 2a 00 17 21 90 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.683545] end_request: I/O error, dev sda, sector 388075520 Jul 25 20:55:24 server kernel: [ 372.687883] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.687890] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.687894] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.687900] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.687904] Write(10): 2a 00 17 21 94 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.687925] end_request: I/O error, dev sda, sector 388076544 Jul 25 20:55:24 server kernel: [ 372.692582] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.692589] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.692594] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.692598] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.692601] Write(10): 2a 00 17 21 98 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.692618] end_request: I/O error, dev sda, sector 388077568 Jul 25 20:55:24 server kernel: [ 372.696831] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.696838] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.696843] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.696849] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.696853] Write(10): 2a 00 17 21 9c 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.696875] end_request: I/O error, dev sda, sector 388078592 Jul 25 20:55:24 server kernel: [ 372.701401] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.701408] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.701412] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.701417] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.701420] Write(10): 2a 00 17 21 a0 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.701436] end_request: I/O error, dev sda, sector 388079616 Jul 25 20:55:24 server kernel: [ 372.705519] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.705526] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.705530] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.705537] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.705541] Write(10): 2a 00 17 21 a4 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.705563] end_request: I/O error, dev sda, sector 388080640 Jul 25 20:55:24 server kernel: [ 372.710427] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.710439] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.710445] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.710452] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.710457] Write(10): 2a 00 17 21 a8 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.710481] end_request: I/O error, dev sda, sector 388081664 Jul 25 20:55:24 server kernel: [ 372.714533] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.714542] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.714547] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.714553] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.714558] Write(10): 2a 00 17 21 ac 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.714599] sd 0:0:0:0: [sda] Unhandled error code Jul 25 20:55:24 server kernel: [ 372.714607] sd 0:0:0:0: [sda] Jul 25 20:55:24 server kernel: [ 372.714611] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT Jul 25 20:55:24 server kernel: [ 372.714618] sd 0:0:0:0: [sda] CDB: Jul 25 20:55:24 server kernel: [ 372.714633] Write(10): 2a 00 17 21 b0 00 00 04 00 00 Jul 25 20:55:24 server kernel: [ 372.714722] ata1: EH complete Jul 25 20:55:25 server mdadm[1414]: Fail event detected on md device /dev/md/0, component device /dev/sda1 MAIL über POSTFIX verschickt Jul 25 20:55:42 server kernel: [ 390.268246] RAID1 conf printout: Jul 25 20:55:42 server kernel: [ 390.268256] --- wd:1 rd:2 Jul 25 20:55:42 server kernel: [ 390.268263] disk 0, wo:1, o:0, dev:sda1 Jul 25 20:55:42 server kernel: [ 390.268268] disk 1, wo:0, o:1, dev:sdb1 Jul 25 20:55:42 server kernel: [ 390.280139] RAID1 conf printout: Jul 25 20:55:42 server kernel: [ 390.280150] --- wd:1 rd:2 Jul 25 20:55:42 server kernel: [ 390.280158] disk 1, wo:0, o:1, dev:sdb1 Jul 25 21:09:01 server CRON[1760]: (root) CMD ( [ -x /usr/lib/php5/maxlifetime ] && [ -x /usr/lib/php5/sessionclean ] && [ -d /var/lib/php5 ] && /usr/lib/php5/sessionclean /var/lib/php5 $(/usr/lib/php5/maxlifetime)) Jul 25 21:17:01 server CRON[1787]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly) Jul 25 21:22:49 server kernel: [ 2017.118172] perf samples too long (2524 > 2500), lowering kernel.perf_event_max_sample_rate to 50000 Gibt es bzgl. der LoadCyclie irgendwo nen Tutorial? Das wollte ich noch konfigurieren, ebenso wie ein gescheites Hardware-Monitoring.
frostschutz Anmeldungsdatum: 18. November 2010 Beiträge: 7657	Zitieren 25. Juli 2014 22:03 (zuletzt bearbeitet: 25. Juli 2014 22:05) Hm, das klingt doch ziemlich schlecht für sda. Kann natürlich auch am Kabel liegen, aber... Lass trotzdem mal smartctl -t long auf sda und sdb. Edit: Ganz ähnliches Fehlerbild, da hat ein Kabelwechsel geholfen: http://forum.ubuntuusers.de/topic/sata-verbindung-friert-bei-last-ein/
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 25. Juli 2014 22:08 (zuletzt bearbeitet: 25. Juli 2014 22:09) frostschutz schrieb: Hm, das klingt doch ziemlich schlecht für sda. Kann natürlich auch am Kabel liegen, aber... Lass trotzdem mal smartctl -t long auf sda und sdb. Edit: Ganz ähnliches Fehlerbild, da hat ein Kabelwechsel geholfen: http://forum.ubuntuusers.de/topic/sata-verbindung-friert-bei-last-ein/ ok, das mache ich gleich noch mal. ich lasse gerade das entsprechende Diagnosetool von der UBCD durchlaufen ... ist zwar ein NAS, Monitor und Tastatur sind aber für den Fall der Fälle angeschlossen ☺
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 26. Juli 2014 18:05 es wurden keine Fehler gefunden. Muss ich vor dem --re-add ein "mdadm --stop /dev/md0 " durchführen? Da meckert der und sagt mir immer mdadm: Cannot get exclusive access to /dev/md0:Perhaps a running process, mounted filesystem or active volume group? Kann ich nun einfach den --re-add machen??? oder was muss ich tun? mounts aufheben??
frostschutz Anmeldungsdatum: 18. November 2010 Beiträge: 7657	Zitieren 26. Juli 2014 18:13 Ja, einfach --re-add machen oder wenn das nicht geht, auch normalen --add. Kein --stop, einem gestoppten RAID kannst du nichts hinzufügen.
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 26. Juli 2014 18:19 ok, der scheint sich nun zu syncen. hoffentlich macht der mir nichts falsch und löscht alle daten ...
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 26. Juli 2014 21:53 frostschutz schrieb: Ja, einfach --re-add machen oder wenn das nicht geht, auch normalen --add. Kein --stop, einem gestoppten RAID kannst du nichts hinzufügen. so, ist nun fertig, ein --re-add klappte nicht, nur ein --add. warum auch immer ... mich wundert nur, das bei sda1 eine 2 und sdb1 eine 1 steht. und bei dem md127 eine 0 und 1, muss man das verstehen? md127 : active raid1 sdd1[0] sde1[1] 976622080 blocks super 1.2 [2/2] [UU] md0 : active raid1 sda1[2] sdb1[1] 732438208 blocks super 1.2 [2/2] [UU]
frostschutz Anmeldungsdatum: 18. November 2010 Beiträge: 7657	Zitieren 26. Juli 2014 21:54 Nein. Diese Nummern sind Zufall, was halt gerade frei ist.
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 26. Juli 2014 22:44 frostschutz schrieb: Nein. Diese Nummern sind Zufall, was halt gerade frei ist. ok, danke. Damit ist das alles hier erst mal gelöst. Den Tipp mit dem Kabeltausch werde ich mir mal merken und so bald es wieder vorkommt, sofort durchführen.
dolfi56 (Themenstarter) Anmeldungsdatum: 13. Mai 2014 Beiträge: 132	Zitieren 17. August 2014 19:33 frostschutz schrieb: Nein. Diese Nummern sind Zufall, was halt gerade frei ist. argh, schon wieder ist es passiert, mit der selben Platte ... habe nun das Kabel getauscht und einen "smartctl -t long" durchlaufen lassen. Es wurde kein Fehler festgestellt und hab es wieder zum Array hinzugefügt ... wenn das nun alle 4 Wochen vor kommt ....

« Vorherige1Nächste »

Antworten |

« Vorheriges Thema Nächstes Thema »