ubuntuusers.de

Unterschiede beim Verify nach Sicherung einer ungemounteten Partition

Status: Ungelöst | Ubuntu-Version: Ubuntu 10.10 (Maverick Meerkat)
Antworten |

bjedpcrt

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

Hallo!

Meine Festplatte ist folgendermaßen unterteilt:

/dev/sda1: NTFS Windows Systempartition
/dev/sda2: NTFS Windows "Eigene Dateien"
/dev/sda3: logische Partition für /dev/sd5 /dev/sda6 /dev/sda7
/dev/sda5: Linux Swap
/dev/sda6: ext4 (Version 1.0) Ubuntu System
/dev/sda7: ext4 (Version 1.0) /home

gesichert werden soll /dev/sda6 auf eine externe Festplatte (USB 1) dabei habe ich knoppix 6.4 von der Live-CD gebootet, wobei /dev/sda5 als Linux Swap für knoppix aktiviert wurde, folgende Kommandos wurden benutzt:

dd if=/dev/sda6 bs=16M > /media/sdb1/UbuntuSystem.img
cmp --bytes=`du -b /media/sdb1/UbuntuSystem.img" | awk '{ print $1}'` <(cat /media/sdb1/UbuntuSystem.img") <(dd if=/dev/sda6 bs=16M)

diese Partition ist 5,5 GB groß. cmp liefert bei ca. 5,1 GB ein unterschiedliches Byte. Bei früheren Sicherungen kam der Fehler nicht beim Wiederholungsaufruf, noch weiter zurück (ca. 4 Sicherungen) gab es keine Probleme. Ist das vielleicht ein Hinweis auf Altersschwäche des betagten Laptops?

Benno-007

Anmeldungsdatum:
28. August 2007

Beiträge: 29240

Wohnort: Germany

Mach doch mal einen Festplattencheck aller beteiligten Platten:

1
2
3
sudo apt-get install --no-install-recommends smartmontools
sudo smartctl -t short /dev/sda
sudo smartctl -a /dev/sda

Nach 2. warten, Ergebnis von 3. bitte hierher kopieren.

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

knoppix@Microknoppix:~$ sudo smartctl -a /dev/sda
smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     IBM/Hitachi Travelstar 60GH and 40GN family
Device Model:     IC25N030ATCS04-0
Serial Number:    CSH306DBCU54SB
Firmware Version: CA3OA71A
User Capacity:    30.005.821.440 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   5
ATA Standard is:  ATA/ATAPI-5 T13 1321D revision 3
Local Time is:    Sun Jul 24 11:22:11 2011 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		 ( 645) seconds.
Offline data collection
capabilities: 			 (0x1b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					No Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					No General Purpose Logging support.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  37) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   136   136   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0012   096   096   000    Old_age   Always       -       7808
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   040   040   000    Old_age   Always       -       26363
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   096   096   000    Old_age   Always       -       6364
191 G-Sense_Error_Rate      0x000a   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       241
193 Load_Cycle_Count        0x0012   053   053   000    Old_age   Always       -       477828
194 Temperature_Celsius     0x0002   152   152   000    Old_age   Always       -       36 (Lifetime Min/Max 10/60)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       13
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     26363         -

Device does not support Selective Self Tests/Logging
knoppix@Microknoppix:~$ 

Benno-007

Anmeldungsdatum:
28. August 2007

Beiträge: 29240

Wohnort: Germany

Schaut ansich noch sehr gut aus! Vielleicht kamen aber deine Probleme daher:

196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       13

Mit anderen Worten: 13 defekte oder fast defekte Sektoren wurden (vermutlich bei deiner Kopieraktion) automatisch gegen Reservesektoren ausgetauscht, anhand der anderen Werte ist nun wieder alles in Ordnung.

  9 Power_On_Hours          0x0012   040   040   000    Old_age   Always       -       26363

26.000 Stunden lief die Platte schon...also über 1000 Tage...die jüngste ist sie nicht mehr, aber noch gesund! 😉

Edit: Eigentlich hätte bezüglich der ersten Zeile kein Datenverlust erfolgen dürfen, da die Daten dabei umgespeichert werden. Ausnahme: Kann ein Sektor nicht mehr gelesen werden, taucht er als Pending Sector (pendelnd/ wartend) in der Tabelle auf. Er würde erst ersetzt, wenn die Daten dort sowieso überschrieben werden sollten. Das passiert bei einer Dateiänderung oder dd etwa. Auch dann gäbe es keinen Datenverlust, da zu überschreibende Daten ja nicht mehr gerettet oder behalten werden müssten.

Ist der Vorgang reproduzierbar? ...

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

ja, ist möglich, ich werde später mal ne andere größere Partition sichern, kann ich mit speziellen Parametern etwas protokollieren?

Benno-007

Anmeldungsdatum:
28. August 2007

Beiträge: 29240

Wohnort: Germany

Defekte Sektoren, die SMART nicht heimlich korrigierend austauscht, tauchen entweder im Log /var/log/syslog (grep -i sector /var/log/syslog) auf oder besser, du verwendest gddrescue, was im Logfile auch gut mit Defekten umgehen kann. dd bricht übrigens beim ersten Fehler ab - war das bei dir nicht der Fall? Bei Option conv=noerror nicht, aber ddrescue aus Paket gddrescue kann versuchen, diesen Sektor mehrfach auszulesen. Syntax ist ähnlich: man ddrescue.

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

grep -i sector /var/log/syslog

liefert:

Jul 24 18:26:16 borisjedamzik-TECRA-9100 kernel: [ 1.118014] ata1.00: 58605120 sectors, multi 0: LBA

also mein dd hat alle Bytes der Partition übertragen, der Unterschied wurde beim cmp gemeldet bei einem Byte fast am Ende der Partition, wo vermutlich keine Daten sich befinden, falls ext4 so gestrickt ist, dass es Daten eher links in der Partition ablegt. Die gesicherte Systempartition ist ja nie vom Datenvolumen her bis in den Bereich des gemeldeten Bytes gewachsen. Aber ich weiß es noch nicht genau.

Ich starte jetzt die Sicherung der Windowspartition unter Ubuntu von Festplatte gebootet, weil ich noch was arbeiten muss. Ich habe dem cmp noch die Option -l beigefügt, um mir alle unterschiedlichen Bytes anzuschaun. Das dauert aber fast die ganze Nacht. Ich melde mich morgen früh wieder, danke erstmal.

Den Tipp mit ddrescure verfolge ich dann anschließend.

bis dann

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

JO, die Sicherung der Windowspartition lief ohne Fehler ab. Keine differierenden Bytes beim cmd.

Ich werde später noch mal die Ubuntu-Systempartition sichern und hoffe, dass dort wieder die Meldung kommt.

Dabei fällt mir gerade ein, könnte auch ein Defekt auf der Zielfestplatte (USB-Externplatte) vorliegen? Leider komme ich mit smartctl da nicht weiter. Auch die "Fenster"-Version von smartctl hat keinen Zugriff. Letzte Woche ist mir aufgefallen, dass md5sum beim dekomprimieren mit zcat und dann mit 7z auf eine frühere gepackte Partitionssicherung auf dieser Externplatte unterschiedliche Werte ausgegeben hat. Das wurde ich schon skeptisch.

Infos zur USB-Platte:

250 GB von Elements (auch schon was älter), wobei SMART nicht unterstützt wird. Eine Partition mit NTFS formatiert

Ich denke mal, dass es mit smartctl nicht funzen wird.

Gibts andere Testmöglichkeiten?

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

Hab was gefunden:

ich lasse gerade

sudo badblocks -vsn /dev/sdb

laufen

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

OHA, laut Fortschrittsanzeige extrapoliert ca. 300 Stunden Laufzeit, aber man kann mit Ctrl-c unterbrechen (2. Lauf auf einem Stick), wo er die letzte Blocknummer angibt und schreibt, dass er aufräumen würde. Offenbar ist dieser Hau-Ruck-Abbruch sauber gelaufen. Man kann bei badblocks aber einen Bereich von zu testenden Blöcken angeben, puhhh, dann muss ich ja nicht meinen Rechner 300 Stunden laufen lassen.

Also dieses Verfahren zieht sich noch ca. 2 bis 3 Wochen hin, bis ich den letzten Block gecheckt habe.

Dann werde ich ab ca. Mittag mit knoppix die Ubuntu-System-Partition noch mal sichern und hoffe auf reproduzierbare cmd-Fehler (mit Parameter -l)

bis dann

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

Ubuntu-System-Partitions-Sicherung ohne Fehler auf den 16G-Stick, ein weiteres Indiz, dass irgend etwas mit der Extern-Festplatte nicht stimmt?

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

ZUsammenfassung:

Sicherung Systempastition Ubuntu auf Externplatte mit dd mit Fehlermeldung beim cmd-Kommando md5sum ermittelt und gespeichert dann die beiden Dateien auf Onlinefestplatte hochgeladen von Externplatte aus md5sum ermittelt von Kopie auf Onlinefestplatte Unterschiede zum gespeichertem md5sum-Egebnis

Dann alles wiederholt, allerdings Stick statt Platte keine Fehlermeldungen, keine Unterschiede in den md5sum

soweit so gut bezüglich der Frage der Reproduzierbarkeit.

FRAGE:

wenn defekte Blöcke auf der Externfestplatte existieren sollten, würde ein normales kopieren CRC-Meldungen oder ähnliches erzeugen? Bisher hatte ich solche Meldungen nch nicht gehabt bei diesem Medium

Benno-007

Anmeldungsdatum:
28. August 2007

Beiträge: 29240

Wohnort: Germany

Gibts andere Testmöglichkeiten?

palimpsest

kommt auch öfter mit externen Festplatten zurecht, ansonsten muss die externe mal intern eingebaut werden.

Dem ersten Absatz des letzten Posts kann man ohne Kommasetzung nur sehr schwer folgen, sollte aber dieses Mal irgendwie reichen.

Uncorrectable Sectors könnten Probleme machen, aber ich würde nicht drauf wetten, dass du eine (CRC-)Fehlermeldung bekommst - wie du ja sogar bei dd gesehen hast - eigentlich bricht dd ja auch beim ersten Fehler ab oder hattest du nun conv=noerror verwendet?

Denke an die Möglichkeit von ddrescue und dem SMART-Test beim Einbau in den Computer. Auch Übertragungsfehler kommen in Frage (Kabel tauschen).

bjedpcrt

(Themenstarter)

Anmeldungsdatum:
8. Februar 2011

Beiträge: 90

dd lief ohne conv=noerror und ist nie abgebrochen

Platte kann ich leider nicht intern einbauen (Laptop) und scheint auch gar nicht möglich zu sein ohne totales Zerlegen?

Laufwerksverwaltung sagt, dass SMART gar nicht unterstützt wird bei dieser Platte, hmmm

Die Theorie mit dem Kabel könnte gut sein, weil, ich habe einen USB-4-er-HUB angeschlossen, dort steckt der 16G-Stick drinnen (Sicherung darauf lief ja ohne Fehler), von dort geht ein schwarzes ca. 1,5 m langes USB-Kabel zur Festplatte.

Ich kann ja mal die Tage die Festplatte ohne den Hub direkt an den Laptop anschließen und die Sicherung wiederholen und schaun, ob Fehlermeldungen kommen, ich nutze da mal ddrescue

Ansonsten checke ich abschnittsweise weiter mit badblocks -vsn (aktuell 7 Mio bis 17 Mio, insgesamt 244 Mio Blöcke, kann noch dauern). Interessant wäre, wenn badblocks nix defektes meldet.

bei palimpsest (Laufwerksverwaltung) klappt alles, außer eine Kleinigkeit: wenn ich badblocks starten möchte muss ich zuerst die Platte aushängen, da kommt eine Busy-Meldung, erst kurz darauf klappt es, UND wenn die Platte nix zu tun hat, dann schnarrt sie leise, sobald Zugriff erfolgt, hört das auf, Verschleiß?

Benno-007

Anmeldungsdatum:
28. August 2007

Beiträge: 29240

Wohnort: Germany

Platte kann ich leider nicht intern einbauen (Laptop) und scheint auch gar nicht möglich zu sein ohne totales Zerlegen?

Da ist in 90% der Fälle einfach nur ein Deckel drüber. Die Anschlüsse bei externen 2,5 Zoll Platten könnten per voreingebautem Adapter passen.

Antworten |