ubuntuusers.de

Du kannst auf dieses Thema nicht antworten, da es gesperrt wurde.

Kernel-Fehlermeldung { DRDY ERR } beim Booten

Status: Ungelöst | Ubuntu-Version: Ubuntu 10.10 (Maverick Meerkat)
Antworten |

ojdo

Anmeldungsdatum:
26. März 2011

Beiträge: 2

Seit der Installation von Ubuntu 10.10 (vorher: Windows 7) auf meinem Dell XPS M1330 mit einer OCZ-Vertex SSD 128 GB (Firmware 1.30) sehe ich beim Booten immer kurz folgende hervorgehobene Meldung (mit Kontext, für den Fall dass dort ein Hinweis für die Ursache stehen könnte):

Mar 26 20:33:42 xps-m1330 kernel: [    2.152522] scsi 2:0:0:0: Direct-Access     ATA      OCZ-VERTEX       1.30 PQ: 0 ANSI: 5
Mar 26 20:33:42 xps-m1330 kernel: [    2.152928] sd 2:0:0:0: Attached scsi generic sg1 type 0
Mar 26 20:33:42 xps-m1330 kernel: [    2.153175] sd 2:0:0:0: [sda] 250069680 512-byte logical blocks: (128 GB/119 GiB)
Mar 26 20:33:42 xps-m1330 kernel: [    2.153485] sd 2:0:0:0: [sda] Write Protect is off
Mar 26 20:33:42 xps-m1330 kernel: [    2.153493] sd 2:0:0:0: [sda] Mode Sense: 00 3a 00 00
Mar 26 20:33:42 xps-m1330 kernel: [    2.153619] sd 2:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Mar 26 20:33:42 xps-m1330 kernel: [    2.154046]  sda: sda1 sda2 < sda5 >
Mar 26 20:33:42 xps-m1330 kernel: [    2.155094] sd 2:0:0:0: [sda] Attached SCSI disk
Mar 26 20:33:42 xps-m1330 kernel: [    2.231336] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
Mar 26 20:33:42 xps-m1330 kernel: [    2.324064] usb 7-1: new full speed USB device using uhci_hcd and address 2
Mar 26 20:33:42 xps-m1330 kernel: [    2.408207] firewire_core: created device fw0: GUID 364fc0004c3ce06e, S400
Mar 26 20:33:42 xps-m1330 kernel: [    2.573545] usb 3-2.1: new full speed USB device using uhci_hcd and address 3
Mar 26 20:33:42 xps-m1330 kernel: [    2.587659] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Mar 26 20:33:42 xps-m1330 kernel: [    2.587693] ata3.00: irq_stat 0x40000001
Mar 26 20:33:42 xps-m1330 kernel: [    2.587729] ata3.00: cmd 06/01:01:00:00:00/00:00:00:00:00/a0 tag 0 dma 2147450880 out
Mar 26 20:33:42 xps-m1330 kernel: [    2.587732]          res 51/04:01:00:00:00/00:00:00:00:00/a0 Emask 0x1 (device error)
Mar 26 20:33:42 xps-m1330 kernel: [    2.587786] ata3.00: status: { DRDY ERR }
Mar 26 20:33:42 xps-m1330 kernel: [    2.587808] ata3.00: error: { ABRT }
Mar 26 20:33:42 xps-m1330 kernel: [    2.587837] ata3.00: device reported invalid CHS sector 0
Mar 26 20:33:42 xps-m1330 kernel: [    2.587865] Adding 5122044k swap on /dev/sda5.  Priority:-1 extents:1 across:5122044k SS
Mar 26 20:33:42 xps-m1330 kernel: [    2.618552] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro
Mar 26 20:33:42 xps-m1330 kernel: [    2.716220] udev[413]: starting version 163
Mar 26 20:33:42 xps-m1330 kernel: [    2.785650] usb 3-2.2: new full speed USB device using uhci_hcd and address 4

In ähnlichen Forenthemen wurde zu einer Überprüfung der Festplatte mittels smartctl geraten. Gesagt, getan. Mit der Interpretation der Ausgabe habe ich aber so meine Probleme:

johannes@xps-m1330:~$ sudo smartctl --all /dev/sda
smartctl 5.40 2010-03-16 r3077 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     OCZ Vertex SSD
Device Model:     OCZ-VERTEX
Serial Number:    *******************
Firmware Version: 1.30
User Capacity:    128.035.676.160 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sat Mar 26 21:24:59 2011 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		 (   0) seconds.
Offline data collection
capabilities: 			 (0x1d) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Abort Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					No Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x00)	Error logging NOT supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   0) minutes.
Extended self-test routine
recommended polling time: 	 (   0) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0000   007   000   000    Old_age   Offline      -       0
  9 Power_On_Hours          0x0000   ---   ---   ---    Old_age   Offline      -       1323
 12 Power_Cycle_Count       0x0000   ---   ---   ---    Old_age   Offline      -       709
184 Initial_Bad_Block_Count 0x0000   ---   ---   ---    Old_age   Offline      -       140
195 Program_Failure_Blk_Ct  0x0000   ---   ---   ---    Old_age   Offline      -       0
196 Erase_Failure_Blk_Ct    0x0000   ---   ---   ---    Old_age   Offline      -       0
197 Read_Failure_Blk_Ct     0x0000   ---   ---   ---    Old_age   Offline      -       0
198 Read_Sectors_Tot_Ct     0x0000   ---   ---   ---    Old_age   Offline      -       4591483751
199 Write_Sectors_Tot_Ct    0x0000   ---   ---   ---    Old_age   Offline      -       4468265791
200 Read_Commands_Tot_Ct    0x0000   ---   ---   ---    Old_age   Offline      -       83693472
201 Write_Commands_Tot_Ct   0x0000   ---   ---   ---    Old_age   Offline      -       86767094
202 Error_Bits_Flash_Tot_Ct 0x0000   ---   ---   ---    Old_age   Offline      -       360472
203 Corr_Read_Errors_Tot_Ct 0x0000   ---   ---   ---    Old_age   Offline      -       292937
204 Bad_Block_Full_Flag     0x0000   ---   ---   ---    Old_age   Offline      -       0
205 Max_PE_Count_Spec       0x0000   ---   ---   ---    Old_age   Offline      -       100000
206 Min_Erase_Count         0x0000   ---   ---   ---    Old_age   Offline      -       4
207 Max_Erase_Count         0x0000   ---   ---   ---    Old_age   Offline      -       3405
208 Average_Erase_Count     0x0000   ---   ---   ---    Old_age   Offline      -       543
209 Remaining_Lifetime_Perc 0x0000   ---   ---   ---    Old_age   Offline      -       100
210 Unknown_Attribute       0x0000   238   000   000    Old_age   Offline      -       0
211 Unknown_Attribute       0x0000   000   000   000    Old_age   Offline      -       0

Warning: device does not support Error Logging
Warning! SMART ATA Error Log Structure error: invalid SMART checksum.
SMART Error Log Version: 1
No Errors Logged

Warning! SMART Self-Test Log Structure error: invalid SMART checksum.
SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


Device does not support Selective Self Tests/Logging

Habe ich ein Hardware-Problem? Oder könnte der Grund der Fehlermeldung durch einen Treiber, Firmwareupgrade oder passende Einträge in Konfigurationsdateien beseitigt werden? [Oder lese ich die Fehlermeldung falsch und hat gar nichts mit der SSD zu tun?]

Für hilfreiche Ratschläge schon im Voraus vielen Dank!

Benno-007

Anmeldungsdatum:
28. August 2007

Beiträge: 29240

Wohnort: Germany

Das sieht nach einem SSD-Hardwarefehler aus, aber ich würde für einen zweiten Blick nochmal googeln, was z.B. DRDY ERR genau bedeuten kann.

184 Initial_Bad_Block_Count 0x0000   ---   ---   ---    Old_age   Offline      -       140

Die Werte heißen hier zwar anders als bei mechanischen Festplatten, aber das sieht mir nach 140 defekten Sektoren aus.

Ich würde beobachten, ob der Wert steigt. Und mal seine Bedeutung genau ergoogeln.

Und wenn das System deswegen schon spinnt oder Meldungen bringt, alles sichern (das sowieso!) und mal alles per dd mit Nullen überschreiben. Das kann SMART anregen, defekte Sektoren durch Reservesektoren zu ersetzen - das macht es erst, wenn die Daten auf dem defekten Sektor überschrieben werden sollen (das muss man also erzwingen).

Denn ansonsten wartet SMART lieber ab, ob man doch noch mal Datenrettungsversuche auf diesen Sektoren unternehmen will oder sie von selbst wieder heile werden (da kannst du lange warten).

Falls du eine Kurzanleitung zu dd brauchst, ich hab hier eine: /Benutzer/Benno-007#Datensicherung-mit-dd. Bei if=/dev/zero überschreibt man mit Nullen. Das Ziel, das gelöscht (!) wird, lautet dann das passende /dev/sdXY.

Dann beobachte die Platte mindestens wöchentlich, später monatlich. Treten neue Fälle defekter Sektoren auf, würde ich sie umtauschen. Das Überschreiben mit Nullen löscht auch die Daten weitestgehend sicher, wobei ich da bei SSDs auch schon andere Artikel gelesen hatte. Aber ich wüßte nicht, wie man es noch besser machen kann, siehe ggf. Google.

Aber so 1 defekter Sektor pro 1-3 Monate kann schon passieren, sage ich mal.

ojdo

(Themenstarter)

Anmeldungsdatum:
26. März 2011

Beiträge: 2

Vielen Dank für die ausführliche Antwort. Da ich das Notebook sowieso nur mit häufigen Backups nutze, werde ich vorerst nur den Bad_Block_Count im Auge behalten. Weil ich demnächst auch noch ein neues Notebook anschaffen werde und dem die SSD spendieren will, werde ich bei der Gelegenheit die "Nullung" per dd drüberlaufen lassen und nachsehen, ob das was Neues zu Tage bringt.

Antworten |