ubuntuusers.de

Sicherheitsfrage zur Raidwiederherstellung nach Plattenausfall

Status: Ungelöst | Ubuntu-Version: Ubuntu 10.04 (Lucid Lynx)
Antworten |

andyron

Anmeldungsdatum:
19. Januar 2012

Beiträge: Zähle...

Hallo zusammen, keine Ahnung ob ich in diesem Forum richtig bin ☹

da nun endlich mein neuer Rechner da ist (NAS/HTPC-Kombination) hab ich mich intensiv mit mdadm beschäftigt. Das hier ist eine theoretische Frage, die ich aber gerne im Vorfeld gefragt haben möchte 😉

Wenn eine Platte in meinem Raid5 ausgefallen ist, und ich die neue einbinde (add) wird das raid ja automatisch neu aufgebaut.

um aber jegliche zugriffe während dieses Zeitraums zu vermeiden (zugriffe von außerhalb) würde ich das raid unmounten. Sind damit wirkliche alle User-bedingten zugriffsmöglichkeiten gesperrt? mit mdadm --stop wird es ja komplett gestoppt, in der Zeit läuft ja auch das rebuilt nicht weiter. ich hoffe meine Frage ist verständlich ☹ ich meine es auch irgendwo mal gelesen zu haben, nur leider finde ich es nicht mehr... sorry

TheDarkRose

Avatar von TheDarkRose

Anmeldungsdatum:
28. Juli 2010

Beiträge: 3459

Warum solltest du während des Rebuild alle Zugriffe stoppen? Das ist ja auch ein Vorteil eines RAID's, Plattentausch im laufendem Zustand.

andyron

(Themenstarter)

Anmeldungsdatum:
19. Januar 2012

Beiträge: 5

jeder zugriff verlangsamt das rebuilt zum einen,und zum anderen erhöht es auch die theoretische fehlerquote. (das rebuilden dauert eh schon lang genug 😀)

Hefeweiz3n Team-Icon

Moderator, Webteam
Avatar von Hefeweiz3n

Anmeldungsdatum:
15. Juli 2006

Beiträge: 5815

Wohnort: Ankh-Morpork

Mach den rebuild doch einfach nachts 😉. Bei meinem Raid5 mit 4 500GB-Platten hat der 6 Stunden gedauert als letztens eine Platte ausgefallen ist (mit sporadischen Zugriffen drauf). Ich hatte eher mit 12 Stunden gerechnet, von daher: Lang find ich ist das nicht.

andyron

(Themenstarter)

Anmeldungsdatum:
19. Januar 2012

Beiträge: 5

nachts ist auch ne möglichkeit ju ... hab mein system heute nacht mit "nur" 3 platten initialisiert und er hat 7 stunden gearbeitet. hab jetzt mal einen platten ausfall simuliert (faulty, remove) und die 4. platte eingebunden ...

Hat die Datenmenge eigentlich einen Einfluß auf die Dauer des Rebuilds ? (wenn er ja eh die kompletten festplatten nue schreibt, dann eigentlich wohl eher nicht oder ?)

Hefeweiz3n Team-Icon

Moderator, Webteam
Avatar von Hefeweiz3n

Anmeldungsdatum:
15. Juli 2006

Beiträge: 5815

Wohnort: Ankh-Morpork

andyron schrieb:

Hat die Datenmenge eigentlich einen Einfluß auf die Dauer des Rebuilds ? (wenn er ja eh die kompletten festplatten nue schreibt, dann eigentlich wohl eher nicht oder ?)

Ich würde sagen ja 😉. Wenn wenig Daten auf dem RAID liegen muss er wenig wiederherstellen. Er geht ja dabei nicht bitweise vor sondern stellt aus den Paritätsdaten die Sachen wieder her. Wenn wenig Daten da sind → Wenig Paritätsdaten → Wenig wiederherzustellen.

andyron

(Themenstarter)

Anmeldungsdatum:
19. Januar 2012

Beiträge: 5

ohje 😉 dann wird ein komplettes rebuild, wenn die platten voll(er) sind, wohl in den Tagebereich gehen 🙄 ok offtopic ^^ aber würde das unmounten reichen 😀 ?

Newubunti

Anmeldungsdatum:
16. Februar 2008

Beiträge: 5149

Da es hier - soweit ich es verstanden habe - ja um Vorüberlegungen geht:

Da RAID 5 den Ausfall genau einer Platte verkraftet, man im Heimbereich eher weniger spezielle Raid-Festplatten einsetzt und die Platten womöglich in einem Block von einem Hersteller bezogen hat und damit die Wahrscheinlichkeit, dass sie aus einer Charge sind recht hoch ist, würde ich - sofern dies nicht automatisch selbst geschieht, zunächst mal den Gesundheitszustand der verbleibenden Platten überprüfen.

Dass man ein aktuelles Backup hat, setze ich jetzt mal voraus, wenn nicht wäre auch das der letzte mögliche Zeitpunkt, um schleunigst eines anzulegen - dann noch vor dem Health-Check.

Gruß, Martin

andyron

(Themenstarter)

Anmeldungsdatum:
19. Januar 2012

Beiträge: 5

äh ja, danke für deinen Beitrag Martin, de facto ist alles richtig was du sagst, aber es ist OT und trägt nicht wirklich zur Beantwortung meiner Frage bei XD

Hefeweiz3n Team-Icon

Moderator, Webteam
Avatar von Hefeweiz3n

Anmeldungsdatum:
15. Juli 2006

Beiträge: 5815

Wohnort: Ankh-Morpork

Mein RAID war recht voll, und mein Server hat auch nicht den schnellsten Prozessor, ich würde aber bei einem halbwegs aktuellen System (Dual Core mit 2GB Ram) davon ausgehen das ca 50MB/s wiederhergestellt werden. Das wären dann knappe 6 Stunden für nen Rebuild bei 1TB-Platten.

encbladexp Team-Icon

Ehemaliger
Avatar von encbladexp

Anmeldungsdatum:
16. Februar 2007

Beiträge: 17525

Es ist übrigens egal ob das RAID "voll" oder "leer" ist, diese Information hat der verwendete Device Mapper nämlich nicht 😉

Der Rebuild nimmt automatisch die Bandbreite die übrig ist, man kann also normal damit arbeiten.

mfg Betz Stefan

Newubunti

Anmeldungsdatum:
16. Februar 2008

Beiträge: 5149

andyron schrieb:

äh ja, danke für deinen Beitrag Martin, de facto ist alles richtig was du sagst, aber es ist OT und trägt nicht wirklich zur Beantwortung meiner Frage bei XD

Mag sein. Allerdings frage ich mich, für was Du ein RAID5 einsetzt, wenn Du dem Rebuild-Prozess nicht traust. Das geht für mich dann schon in die Richtung RAID-Fehlplanung. Selbst wenn dabei die Peformance bei Software-RAID je nach vorhandener Hardware beeinträchtigt, wäre. Was macht das schon?

Denn Sinn des RAID5 ist nun mal, dass der Rebuild parallel zum Betrieb laufen kann. Ansonsten könnte aus meiner Sicht auf RAID5 verzichten und dann vielleicht eher RAID1 oder RAID0 einsetzen, was dann nicht den ganzen Rechenaufwand von RAID5 braucht und von daher performanter ist.

Theoretisch kann es auch sein, dass es zu Fehlern in der Paritätsberechnung aufgrund von RAM- oder CPU-Fehlern kommt, zumal die meisten Home-Server kein ECC-RAM verwenden. Über die Wahrscheinlichkeit eines solchen Ereignisses kann man gleichwohl kräftig streiten. Aber wenn man schon über theoretische Fehler spricht, dann gehört das mit in die Betrachtung.

Wenn beim Rebuild etwas schief geht, hast Du ja auch immer noch das Backup.

Wenn Software-RAID so unzuverlässig wäre, dass es bei RAID5 nicht den Rebuild parallel zum Betrieb schafft, dann wäre es aus meiner Sicht für diesen RAID-Level schlicht nicht einsatzfähig.

Dass es noch irgendwelche theoretischen Restrisiken gibt, will ich damit gleichwohl nicht ausschließen, aber dann sind wir ja wieder beim Backup.

Gruß, Martin

aurel81

Anmeldungsdatum:
10. Mai 2011

Beiträge: 42

Natürlich hast du auch recht, aber wo ist denn die unfassbare sensation wenn man Fehlerquellen vermeiden möchte, die wirklich vermeidbar sind ?! ECC Ram ist ein gutes Stückchen teurer und verträgt sich nicht mit jedem Board CPU-Fehler können passieren, aber darauf hat der User auch keinen Einfluss. Zusätzlicher Zugriff auf einen Raid kann Fehler verursachen und ist simpel zu vermeiden. Natürlich ist es auch eine mögliche Fehlerquelle,ein SW Raid ohne USV zu betreiben pipapo. Jeder macht sich seine Gedanken über Fehlerquellen oder eben nicht.

Newubunti

Anmeldungsdatum:
16. Februar 2008

Beiträge: 5149

Ich hätte erst mal gerne ein Beleg für die Theorie, dass die Nutzung eines RAIDs während des Rebuilds ein vermeidbarer Fehler ist.

Klar kann man während des Rebuilds auf die Nutzung des RAIDs verzichten. Dass man dadurch irgend eine Gefahr mildert möchte ich aber dann gerne belegt haben, weil nämlich der Verzicht auf den Zugriff während des Rebuild nun mal heißt, keine Verfügbarkeit.

Aber gerade wegen der Verfügbarkeit setzt man nun mal ein (auch) auf Verfügbarkeit angelegtes RAID ein. Brauche ich dagegen die Verfügbarkeit nicht, dann frage ich mich für was ein RAID 5, dass mir ja beim Schreiben immer auf die Performance geht? Da bliebe ja dann nur noch das Argument der besseren Platznutzung gegenüber z.B. RAID 1.

Geht es aber nur um die optimale Platzausnutzung, dann kann ich mir den ganzen Paritäts-Rechenaufwand - der generell ein erhöhtes Risiko darstellt, aber nicht beim Rebuild im speziellen - sparen und nehme dann halt nur LVM.

Wenn der Rebuild so ein Risiko wäre, dann müsste das ja irgendwo nachlesbar sein. Wäre das so, dann wäre es wie gesagt Broken by Design.

Im übrigen verstehe ich auch die Panik nicht, die man vor einem Fehler hat, weil ja noch ein Backup vorhanden ist oder ist dann doch die Verfügbarkeit wichtig?

Ich sehe da beim RAID ganz andere vermeidbare Fehlerquellen, z.B. den Austausch der falschen Platte, dass man das gesamte System - insbesondere Speicher und Platte ohne ausführlichen Test in den Einsatz schickt oder eben auch die gesamte Fehlplanung.

Ich kann mir auch einen Profi-Enterprise-Server einrichten und stelle den dann ohne jedweden Anschluss in einen Safe. Da ist der auch sicherer, als wenn er läuft.

Gruß, Martin

stfischr Team-Icon

Avatar von stfischr

Anmeldungsdatum:
1. März 2007

Beiträge: 19197

Hi.

Ich kann da Newubunti nur zustimmen. Wozu wird ein Raid verwendet, wenn man mal eben > 6 Stunden Ausfallzeit für quasi nix in Kauf nehmen kann? Da kann man genauso gut nen Backup mit Rsync laufen lassen. Das ist dann auch schneller wieder hergestellt, weil nur die belegten Datenbereiche kopiert werden müssen. Und nen Backup braucht man ja sowieso.

Antworten |