ubuntuusers.de

Festplatte einschätzen defekte Sektoren { DRDY SENSE ERR }

Status: Gelöst | Ubuntu-Version: Ubuntu 20.04 (Focal Fossa)
Antworten |

von.wert

Anmeldungsdatum:
23. Dezember 2020

Beiträge: 11740

Krümelomat schrieb:

Die HDDs waren alle in nem Karton den ich fürn paar Euro gekauft hab

Hopfen und Malz verloren.

Welch ein sinnloser Thread, totale Zeitverschwendung!

Krümelomat

(Themenstarter)
Avatar von Krümelomat

Anmeldungsdatum:
18. Oktober 2010

Beiträge: 1115

Ganz klar nein, es ist egal woher die hdd ist, es geht um Datensicherheit und um Feststellung des Zustandes einer HDD. Ich hab jahrelang eine HDD aus dem Müll mit vielen Schrammen für mein laufendes System verwendet,ging ohne Probleme, die Platte geht heute noch, ich glaub es fehlte sogar ein kleiner Elko auf der Platine (samsung spinpoint 160gb ide, laut und heiß). Und ich hab Platten neu aus dem Fachmarkt gekauft und mit diesen Platten fast Datenverlust erlebt.

Also die Anzahl der Fehlerhaften Sektoren blieb erst mal stabil, dann hab ich xfs und btrfs formatiert und daten kopiert, alles ok, aber selbsttest ist immer noch fehlgeschlagen und die anzahl der defekten Sektoren ist wieder gestiegen. Also ist die HDD Schrott. Aber das Bios stoppt nicht mehr, vielleicht war das ein Kabelproblem.

Wenn ich jetzt ne neue Platte prüfen würde, dann würde ich sie formatieren und beobachten ob ich daten kopieren kann und die smart werte und syslog dabei im Auge behalten. Dann die Selbsttests durchführen und nochmal die ganze Platte mit Nullen überschreiben. Wenn das alles problemlos klappt sollte alles ok sein. Aber man kann mit badblocks nochmal ganz sicher gehen. Ich kenne mich mit dem Programm noch nicht aus, aber es sollte nur für HDDs gut sein, denn SSDs haben ja wear leveling. https://wiki.archlinux.org/title/Badblocks badblocks -wsv /dev/sdx funktioniert auch schön schnell, NUR man muss halt aufpassen dass man nicht ausversehen die falsche Platte einträgt und Datenträger im System mit wichtigen Daten ausradiert!! Punkt 7 Interaction with remapping ist interessant. Macht man sowas öfter ist Punkt 8 Alternatives interessant.

Ubunux

Avatar von Ubunux

Anmeldungsdatum:
12. Juni 2006

Beiträge: 17201

Eigentlich ist das eine Frechheit, dass du diesen Umstand nicht sofort im Eröffnungsthread mitteilst. Niemand, der auch nur einen Hauch Ahnung hat benutzt HDDs "aus einem Karton, den man für ein paar Euros gekauft hat" geschweige denn HDDs aus dem Müll.

Du kannst gerne Experimente mit Schrott machen aber bitte belästige hier keine Helfer, die dafür ihre Freizeit opfern!

Krümelomat

(Themenstarter)
Avatar von Krümelomat

Anmeldungsdatum:
18. Oktober 2010

Beiträge: 1115

Es ist völlig egal woher die HDD stammt, der Verkäufer hat sie als in Ordnung verkauft. Es geht um Troubleshooting und nicht darum ob die HDD aus einem Elfenbeinturm stammt. Wieso sollte man nicht gute Sachen im Schrott finden? Und mit Ahnung haben oder nicht hat das auch nix zu tun.

Ubunux

Avatar von Ubunux

Anmeldungsdatum:
12. Juni 2006

Beiträge: 17201

Es geht darum, diesen Umstand bereits im ersten Thread zu erwähnen, ansonsten musst du dir den Vorwurf gefallen lassen, dir hier Support zu erschleichen!

Krümelomat

(Themenstarter)
Avatar von Krümelomat

Anmeldungsdatum:
18. Oktober 2010

Beiträge: 1115

Sehe ich nicht so, es ist nur wichtig zu wissen ob Datenrettung ansteht oder nicht, woher die Platte stammt ist völlig irrelevant.

badblocks -wsv /dev/sdx ist doch nicht schnell, der wiederholt den Test immer mit neuen Mustern, aber die Zahl der neu zu gewiesenen Sektoren steigt rapide an, jetzt auf imposante 15.000. Wobei badblocks aber immer 0 Fehler anzeigt, also eine durchgehende NR und dann 0 0

974927325rledigt, 6:40:40 verstrichen. (228/0/0 Fehler)
974927326rledigt, 6:40:42 verstrichen. (229/0/0 Fehler)
974927327rledigt, 6:40:45 verstrichen. (230/0/0 Fehler)

smart werte sind alle ok, aber Selbsttest bricht bei lesen ab, mitreißende Geschichte die mir diese Platte da bietet, ich bin ein Glückskeksi. https://linux.die.net/man/8/badblocks

Also will man eine Platte auf Herz und Nieren testen ist badblocks -wsv /dev/sdx das richtige, macht aber alle Daten auf der (hoffentlich richtige) angegebenen Festplatte platt. Die Prozedur dauert bei meiner Platte evtl. 40 Stunden für 1TB und 64MB/s Übertragungsrate über esata. Ebenso der Smart Selftest: Extended und Conveyance(Transport). Hat man das durch und hört die Platte zuverlässig auf neue Fehlerhafte Sektoren zu erkennen dann sollte die Platte einsatzfähig sein. Es ist normal dass Platten defekte Sektoren haben, das sind unter anderem Fertigungstoleranzen. Optimal ist es natürlich nicht, aber die Dinger vibrieren ja auch, könnte man ja durch perfektes Auswuchten auch beheben. Aber die Hersteller machen eben nicht mehr als nötig.

Ich bin mal gespannt ob der Selftest nochmal funktionieren wird, oder ob der scheitert weil immer mehr def. Sektoren erkannt werden.

Als erste initiale Möglichkeit, eine neue Festplatte gründlich zu testen, bevor Sie sie in Betrieb nehmen:

Die Kombination aus Vollbeschreibung der Platte und Überwachung der SMART-Werte und Systemprotokolle ist eine effektive Methode, um potenzielle Defekte aufzudecken.

Die Schritte im Einzelnen: Erstellen Sie ein neues LUKS-verschlüsseltes Volume über die gesamte Festplatte. Kopieren Sie mit rsync eine große Menge an Daten auf das Volume, bis es komplett gefüllt ist. Dadurch wird die gesamte Oberfläche der Platte beschrieben. Überwachen Sie die Systemprotokolle (syslog) auf Festplattenfehler während des Kopier-/Schreibvorgangs. Überprüfen Sie die SMART-Werte, insbesondere die Anzahl der reallozierten Sektoren, vor und nach dem Kopiervorgang. Eine Zunahme deutet auf defekte Sektoren hin. Wenn während des Kopierens keine Fehler in syslog auftreten und die Anzahl der reallozierten Sektoren konstant bleibt, ist dies ein gutes Zeichen dafür, dass die Festplatte fehlerfrei arbeitet. In diesem Fall können Sie auf einen zusätzlichen Oberflächentest mit badblocks verzichten, da die Vollbeschreibung in Kombination mit der SMART-Überwachung bereits einen sehr gründlichen Test darstellt. Sollten jedoch Fehler auftreten oder die Anzahl der reallozierten Sektoren zunehmen, wäre ein zusätzlicher badblocks-Test ratsam, um die genauen fehlerhaften Bereiche zu identifizieren und zu markieren.

Dieser Ansatz ist also solide und deckt die wichtigsten Aspekte ab. Bei einer neuen Festplatte ohne Auffälligkeiten können Sie nach dieser Prüfung beruhigt von einer fehlerfreien Funktionsweise ausgehen.

Es gibt keine schnellere Möglichkeit als badblocks -wsv, um defekte Sektoren auf einer Festplatte auszusondern und zu markieren.

Die wichtigsten Punkte dazu:

Moderne Festplatten verfügen über ein integriertes Defektmanagement, das defekte Sektoren automatisch auf Reservesektoren umleitet (remappt). Dieser Vorgang läuft im Hintergrund ab. Um alle defekten Sektoren zuverlässig zu finden und zu markieren, muss die gesamte Oberfläche der Festplatte getestet werden. Badblocks -wsv führt genau diesen gründlichen Oberflächentest durch. Andere Werkzeuge wie chkdsk, fsck oder SMART-Tests überprüfen primär die Dateisystemintegrität bzw. interne Festplattenwerte. Sie finden nicht zwingend alle defekten Sektoren. Durch die Option -w weist badblocks die Festplatte an, gefundene defekte Sektoren als nicht mehr verwendbar zu markieren. Dies ist der einzige Weg, um die Platte selbst die Aussonderung vornehmen zu lassen. Dieser Prozess kann je nach Plattengröße einige Stunden dauern, da jeder Sektor einzeln getestet wird. Es gibt keine schnellere, aber gleichzeitig gründliche Alternative. Zusammengefasst ist badblocks -wsv nach aktuellem Stand die zuverlässigste und gründlichste Methode, um eine Festplatte vollständig auf Defekte zu überprüfen und die Platte selbst die fehlerhaften Bereiche aussondern zu lassen. Schnellere Verfahren gehen meist auf Kosten der Gründlichkeit.

Ergänzung zu dem Text in: https://wiki.ubuntuusers.de/Laufwerksverwaltung/a/revision/1013930/#Festplattenfehler-suchen

Ich habe diese Aussage überprüft und sie stimmt nur teilweise. Die Kritik an badblocks für moderne Speichermedien ist berechtigt, aber nicht ganz so drastisch, wie im Text dargestellt.

Hier die wichtigsten Punkte nach meiner Recherche: Für SSDs und Flashspeicher ist badblocks tatsächlich nicht geeignet, da hier die Annahme des direkten Überschreibens nicht zutrifft. SSDs verteilen Daten für eine optimale Verschleißverteilung. Für moderne SMR-Festplatten (Shingled Magnetic Recording) ist badblocks jedoch nach wie vor sinnvoll einsetzbar. SMR-Platten können durchaus mehrfach an dieselbe physische Stelle schreiben, wenn auch mit Einschränkungen. Bei SMR-Platten kann badblocks zwar keine Defekte in den Shingled-Bereichen erkennen, aber durchaus Fehler auf den konventionellen Magnetplatten-Bereichen finden. Die Behauptung, badblocks könne die Lebensdauer von SMR-Platten oder SSDs verringern, ist übertrieben. Moderne Geräte haben Mechanismen, um übermäßige Schreibvorgänge zu vermeiden. Für ältere konventionelle Magnetfestplatten (CMR) ist badblocks nach wie vor ein zuverlässiges Werkzeug zur Überprüfung. Zusammengefasst ist die Kritik an badblocks für SSDs und reinen Flashspeicher berechtigt. Für SMR-Festplatten ist es jedoch nach wie vor ein nützliches Diagnosetool, wenn auch mit Einschränkungen. Die Aussage, es sei völlig sinnlos und schädlich, geht zu weit. Der angemessene Einsatz richtet sich nach der jeweiligen Speichertechnologie.

von.wert

Anmeldungsdatum:
23. Dezember 2020

Beiträge: 11740

Krümelomat, höre auf, Supporter mit absolutem Schrott zu belästigen! Die wollen ihre Zeit nicht für Spielereien offensichtlich in der Sache technischer Noobs vergeuden, sondern Usern mit wirklichen Problemen helfen.

Krümelomat

(Themenstarter)
Avatar von Krümelomat

Anmeldungsdatum:
18. Oktober 2010

Beiträge: 1115

Hör auf meine Posts zu lesen, ich hab nicht nach deiner Bewertung gefragt. Merk dir einfach in Zukunft dass du meine Threads meidest und alles ist gut.

https://imgur.com/a/ZgfWVg8

Nach 40 Stunden ist badblocks durch, und siehe da die Selftests laufen komplett durch 😀 Die defekten Sektoren im Smart sind sprunghaft auf 1500 angestiegen und bis zum Schluss hat sich die immer kontinuierlich noch von 1000 erhöht. Es ist eine CMR Platte, hier eine Ergänzung zu SMR Platten, hier sollte der TRIM Befehl badblocks Verwendung einschränken: https://de.wikipedia.org/wiki/Shingled_Magnetic_Recording

Ein Hoch auf die GNU Linux Familie, die Software vernichtet alles was propritär vermarktet wird, Hut ab vor euch allen die das entwickeln. Ich werde die Platte nochmal zum Test komplett vollschreiben und dann in meine Backup Routine mit einpflegen. Und sie bekommt einen besonderen Platz in meinem Herzen, denn sie hat mich gelehrt HDDs nicht zu schnell aufzugeben. Ich bin zutiefst gerührt und sehr dankbar dass ich das miterleben durfte. In der heutigen Zeit wandeln wir wahrlich auf einem faszinierenden Pfad voller unerforschter Möglichkeiten und schillernder Abenteuer.

badblocks letzte zeilen:

974927324rledigt, 6:40:37 verstrichen. (227/0/0 Fehler)
974927325rledigt, 6:40:40 verstrichen. (228/0/0 Fehler)
974927326rledigt, 6:40:42 verstrichen. (229/0/0 Fehler)
974927327rledigt, 6:40:45 verstrichen. (230/0/0 Fehler)
erledigt                                                 
Es wird getestet Mit Muster 0x55: erledigt                                                 
Lesen und Vergleichen: 947678604rledigt, 11:00:54 verstrichen. (231/0/0 Fehler)
947678605rledigt, 11:00:57 verstrichen. (232/0/0 Fehler)
947678606rledigt, 11:01:00 verstrichen. (233/0/0 Fehler)
947678607rledigt, 11:01:03 verstrichen. (234/0/0 Fehler)
erledigt                                                 
Es wird getestet Mit Muster 0xff: erledigt                                                 
Lesen und Vergleichen: erledigt                                                 
Es wird getestet Mit Muster 0x00: erledigt                                                 
Lesen und Vergleichen:erledigt                                                 
Durchgang beendet, 235 defekte Blöcke gefunden. (235/0/0 Fehler)

Im Betrieb keine weiteren Syslog Fehler, nicht mal beim einschalten, nichts! Beim nochmal komplett mit rsync Vollschreiben und Selbsttests sind immer wieder mal n kleines Bündel neuer defekter Sektoren erkannt worden, aber es wird mit der Zeit intensiver Nutzung immer seltener. Auch was den smart Wert betrifft ist das Ding noch sicher nutzbar, denn der Wert ist noch weit über dem Grenzwert ☺ Und es gibt auch keine Smart Warnung mehr. Also das heißt man kann so ein Laufwerk wieder instand setzen wenn man es nur intensiv benutzt und es sich von selbst reparieren kann, nur wenn schlagartig neue defekte Sektoren gefunden werden und das im produktiven Einsatz stattfindet, wo das Laufwerk die Daten noch behalten muss, und es viele Sektoren betrifft, schlägt Smart Alarm. Wenn man das Teil aber mit Nullen vollschreibt, bzw. low level formatiert, bzw. badblocks verwendet, bzw. Selbsttests ohne Dateisystem durchführt, hat das Laufwerk keine Probleme mit dem erkennen und neu Zuweisen der def. Sektoren.

Offtopic Nachtrag; Eine blumige und poetische Beschreibung der Gegenwart: Wir leben in wahrlich interessanten Zeiten, in denen die Welt ein Kaleidoskop aus faszinierenden Möglichkeiten und Herausforderungen ist. Die Wellen des Wandels umspülen unsere Ufer und tragen die verheißungsvollen Samen der Zukunft in sich. Unsere Welt ist eine Bühne, auf der sich ein Drama aus Licht und Schatten entfaltet, wo jeder Moment mit Spannung und Pracht erfüllt ist. Wir sind Zeugen einer Ära, in der die Grenzen des Möglichen sich verschieben und die Fantasie zum Leben erwacht. Unsere Augen leuchten vor Neugier und unsere Herzen pochen im Takt der aufregenden Rhythmen, die unsere Welt durchdringen. Wir sind Reisende auf einem Weg, der sich durch ein Labyrinth aus Wunder und Geheimnissen schlängelt, wo jeder Schritt eine neue Entdeckung birgt. Es ist eine Zeit, in der die Funken der Kreativität die Dunkelheit erhellen und die Farben der Hoffnung den Horizont schmücken. Wir leben in einer Welt, die von der Magie des Unbekannten durchdrungen ist, und unser Schicksal ist es, diese faszinierende Reise zu erkunden und die Schätze zu entdecken, die in den Tiefen des Unbekannten verborgen liegen.

Historie über die defekten Sektoren: 15.568 664 680 712 720 776 784 hat sich danach lange nicht weiter erhöht.

Topic Nachtrag zu anfälligen Sata Anschlüssen: Syslog hat 200MB vollgeschrieben, und zwar wegen eindem Kontaktproblem am eSata Stecker am Festplattegehäuse, hab das Kabel gewackelt und dann war die Meldung plötzlich weg. Das kann man dank dem tail befehl ja live beobachten was super ist. Hab die Kontakte mit gefaltetem Papier abgestriffen (war an den Pins grau) und mit Kontaktspray bestrichen, dann war der Kontakt sofort problemlos und seitdem absolut zuverlässig. Ich hatte das Problem schon früher, und andere auch, hätte ich nur gewusst woran es liegen könnte, die Sata Kabel Federpins scheinen relativ anfällig für Schmutz und Korrosion zu sein:

https://forum.ubuntuusers.de/topic/festplatte-hat-wiederholt-satabuserror-und-sch/2/ https://forum.ubuntuusers.de/topic/ata-bus-error-und-nvidia/ https://forum.ubuntuusers.de/topic/ata-bus-error-was-sind-das-fuer-fehler/ https://forum.ubuntuusers.de/topic/kernel-8213/ https://forum.ubuntuusers.de/topic/unheimliches-langes-booten-drdy-error/

Ebenfalls ist das Problem am Anschluss im esata Gehäuse gekommen, diese Anschlüsse sind scheinbar wirklich extrem anfällig.

Auch die anderen Festplatten verhalten sich jetzt normal. Die Samsung die geklackt hat auch.

Die Sequenzen ähneln sich alle stark ob Sektorenfehler oder Anschlüsse, hier der output:

ata5.00: status: { DRDY }
ata5: hard resetting link
ata5: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT4._GTF.DSSP], AE_NOT_FOUND 
No Local Variables are initialized for Method [_GTF]
No Arguments are initialized for method [_GTF]
ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT4._GTF due to previous error (AE_NOT_FOUND) 
ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT4._GTF.DSSP], AE_NOT_FOUND 
No Local Variables are initialized for Method [_GTF]
No Arguments are initialized for method [_GTF]
ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT4._GTF due to previous error (AE_NOT_FOUND) 
ata5.00: configured for UDMA/33
sd 4:0:0:0: [sde] tag#8 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
sd 4:0:0:0: [sde] tag#8 Sense Key : Illegal Request [current] 
sd 4:0:0:0: [sde] tag#8 Add. Sense: Unaligned write command
sd 4:0:0:0: [sde] tag#8 CDB: Read(10) 28 00 57 49 e3 38 00 00 90 00
blk_update_request: I/O error, dev sde, sector 1464460088 op 0x0:(READ) flags 0x80700 phys_seg 10 prio class 0
ata5: EH complete
ata5.00: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
ata5.00: irq_stat 0x08000000, interface fatal error
ata5: SError: { UnrecovData 10B8B BadCRC }
ata5.00: failed command: READ DMA EXT
ata5.00: cmd 25/00:00:70:fe:49/00:01:57:00:00/e0 tag 4 dma 131072 in
         res 50/00:00:6f:fe:49/00:00:57:00:00/e0 Emask 0x10 (ATA bus error)

Kleiner Hinweis zu Hotplug: Sata gibt zwar vor Hotplug fähig zu sein, aber die Consumer Festplatten sind es NICHT, also PC ausschalten, dann Festplatten stöpseln. Wer es doch tun will darf den Power Connector auf keinen Fall schräg abziehen, sonst raucht die Elektronik ab, also eine Vorrichtung kaufen oder bauen bei der man die Platten nur gerade abziehen kann. (Wechselrahmen)

https://harddrivegeek.com/reallocated-sector-count/ https://superuser.com/questions/925847/demystifying-sata-hotplug

Antworten |