Da es das Hardwareforum nicht mehr gibt, versuche ich es mal hier.
Seit Anfang der Woche habe ich Probleme mit einem Rechner. Das Hauptproblem ist, das die zweite Festplatte nach ca. 30 Minuten sporadisch stehen bleibt. Manchmal komplett aber manchmal läuft sie nach 1 bis 2 Minuten Pause wieder weiter als wenn nichts gewesen wäre. Während dieser Zeit ist die CPU-Auslastung 100%. Man kann sich aber mit ssh noch einloggen und fast normal arbeiten, sofern man die 2-te Platte nicht anspricht.
Die letzten Tage habe ich damit verbracht eine Datensicherung durchzuführen, jeden Tag 30 Minuten mit rsync bis zum Stehenbleiben.
Mein Problem ist jetzt, wie finde ich die Ursache für diesen Fehler. Mit smartctl -A /dev/hdc kann ich eigentlich nichts besorgniserregendes entdecken:
mbox:/# smartctl -A /dev/hdc ... 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 18 194 Temperature_Celsius 0x0022 109 109 000 Old_age Always - 43 (Lifetime Min/Max 25/43) 195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 5 ... 223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 1 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 183
Nachdem die Platte das erste Mal stehengeblieben ist, zeigt dmesg:
... ReiserFS: hdc1: found reiserfs format "3.6" with standard journal ReiserFS: hdc1: using ordered data mode ReiserFS: hdc1: journal params: device hdc1, size 8192, journal first block 18, max trans len 1024, max batch 900, max commit age 30, max trans age 30 ReiserFS: hdc1: checking transaction log (hdc1) ReiserFS: hdc1: Using r5 hash to sort names hdc: dma_timer_expiry: dma status == 0x61 hdc: DMA timeout error hdc: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest } ide: failed opcode was: unknown hdc: dma_timer_expiry: dma status == 0x61 hdc: DMA timeout error hdc: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest } ide: failed opcode was: unknown hdc: dma_intr: status=0x58 { DriveReady SeekComplete DataRequest } ide: failed opcode was: unknown hdc: dma_timer_expiry: dma status == 0x61 hdc: DMA timeout error hdc: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest } ide: failed opcode was: unknown hdc: dma_timer_expiry: dma status == 0x61 hdc: DMA timeout error hdc: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest } ide: failed opcode was: unknown
Momentan stehe ich völlig auf dem Schlauch. Nach ca. 20 Minuten konnte ich heute mein Backup vollenden. Etwa 30 Minuten später kam der erste Stillstand und jetzt läuft die Kiste schon seit über einer Stunde wider Problemlos.
Wie kann ich nun feststellen, ob es die Platte oder das MoBo ist? Villeicht sollte ich noch erwähnen, das es sich dabei um einen headless Server ohne GUI handelt.