ubuntuusers.de

Server 10.04 und RAID - nur Probleme

Status: Ungelöst | Ubuntu-Version: Server 10.04 (Lucid Lynx)
Antworten |

hdz

Avatar von hdz

Anmeldungsdatum:
24. Juni 2006

Beiträge: 88

Wohnort: Bayreuth

Hallo Forum,

mein Homeserver (Intel Atom 330, 2GB RAM, 4xS-ATA HDD) lief bisher zufriedenstellend mit der Server Edition 8.10 x86, nach dem Erscheinen der aktuellen LTS-Version war ein Upgrade fällig: diesmal Server Edition 10.04 x86-64. Der Plan ist folgender: die 4 500GB HDDs sollten so partitioniert werden:

2 x 1GB als RAID 1 -> /boot
2 x 1GB swap
4 x 2GB als RAID5 -> /
4 x 497GB als RAID10 -> /data

Der Spaß bekann aber schon vor Beginn der Installation: das Server-Edition Installations-Image hat wohl ein paar Probleme mit einem USB-Stick als Medium (offiziellen USB-Startmedienersteller verwendet, der sich schon bei div. Desktop-Installationen bewährt hatte). Erstmal läuft weder Memtest noch der CD-Check vom Stick. Image not found. Der Installer startet zumindest schonmal. Bis zur Hardwareerkennung funktioniert auch alles, bei dieser wird aber offensichtlich das USB-Subsystem kaputt konfiguriert, so dass weder der Stick danach scheinbar nicht mehr dem Installer zur Verfügung steht, die Installation so also nicht geht.

Also erstmal den Keller nach einem CD-Laufwerk durchsuchen. Gefunden, angeschlossen, Installation gestartet. Installation lief nach Hardwareerkennung weiter, bei nächster Interaktion fiel aber auf, dass seitdem auch die USB-Tastatur nicht mehr funktioniert. Installation damit nicht fortsetzbar. Problem beliebig reproduzierbar, egal ob im BIOS USB-Legacy aktiviert war oder nicht. Also Keller nach einer PS/2-Tastatur durchforstet und zum Glück sogar gefunden. Auch das Mainboard konnte eine solches Interface noch aufweisen. Mit antiken Komponenten wie dem P-ATA-CD-ROM-LW und der klassischen PS/2-Tastatur kam ich mir in die Zeit von Hoary Hedgehog zurückversetzt vor, der Installer kam damit aber wenigstens klar. Nur eine unvollständige Installation fortzusetzen war nicht möglich.

Also Neuinstallation, alles während der Installation wie o.g. partitioniert, RAID konfiguriert, FS erzeugt (je ext4) usw... 1. Neustart → nichts, außer einer Meldung à la "Gave up waiting for root device" und der Notfall-Busybox. Dieser Fehler tritt wohl häufiger auf, lässt sich bei einigen mit den sinnlosesten Konfigurationen umgehen, bei anderen nicht. Wie bei mir. Daraufhin GRUB2-Konfig geprüft, keine Fehler gefunden. Konfiguration auf das minimalste zusammengeschrumpft, der Fehler blieb. GRUB-Legacy installiert und ... selbes Problem. Das System lies sich nicht starten. Bis ich durch Zufall drauf gekommen bin, dass das 4x497GB-RAID10 nach der Erstellung noch am resyncen ist. Eigentlich sollte sich das System auch mit einem degraded RAID starten lassen, nur scheint das so nicht möglich zu sein. Also neui installiert, dabei das /data-Volume weg gelassen und es ging. System konnte zuverlässig starten. Mehrfach. Also nächster Schritt: RAID im laufenden System angelegt, komplett recovern lassen und Neustart war immer noch möglich. Hurra?

Dann kam ich auf die Idee, statt RAID10 ein RAID5 zu nutzen, da die Performance (an der root-Partition gemessen) völlig ausreichte. Also erstmal Array aus mdadm.conf entfernt und fstab bereinigt. System neugestartet, letzte Meldung vor Freeze: "init: unreadahead-other main process (???) terminated with status 4". Prima. Live-CD genommen, mdadm.conf und fstab wieder in ursprünglichen Zustand versetzt, neu gestartet und lief. Auch das alte RAID stoppen und das RAID5 erstellen, formattieren, recover abwarten und neustarten ging nicht. Es war mir überhaupt nicht möglich, das System mit der mdadm.conf und fstab zu starten, wie es vor Anlegen des RAID10 geklappt hat. Das System startete einfach nicht, die Fehlermeldung kam zuverlässig jedesmal. Nichtmal der Recovery Mode brachte Abhilfe.

Also nochmal neu installieren. Ohne /data-RAID. Alles geklappt, neu gestartet und RAID5 angelegt, mdadm.conf und fstab angepasst (garantiert die richtigen UUIDs verwendet - 100mal geprüft). Nachdem das RAID wieder komplett recovered war also wieder neu gestartet. Jetzt kommt aber was neues: das System startet einfach neu - wie Hard-Reset. Ich kann zwar mit Shift das GRUB2-Menü aufrufen, aber noch bevor das angezeigt wird, startet das System neu. Ich hab also nichtmal ne Log-Datei ☹

Hardware-Schäden kann ich weitestgehend ausschließen: Memtest liefert keine Fehler, Temperaturen stimmen alle, Festplattenschäden konnte ich auch keine finden. Alle RAIDs und die darauf liegenden Volume sind OK, Zugriff über LiveCD funktioniert problemlos. Es muss wohl irgendwo an der Konfiguration liegen. Hab ich irgendwas vergessen anzupassen? Spielt btw keine Rolle, ob ich das mit der 32- oder 64-bit-Version versuche.

Kann man da noch was machen? Sollte ich auf Windows Server 2008 umsteigen? 😛 Ich hab in den letzten Jahren ja diverse Linuxe und viele Ubuntus installiert und gewartet, Kenntnisse der Materie sind schon da. Aber das war etwas völlig Neues. Eine derartige Aneinanderreihung von gravierenden Fehlern ist mir dabei noch nicht untergekommen. Für ne LTS-Version scheint mir das etwas mit der heißen Nadel gestrickt zu sein, eine Installation sollte in jedem Fall mit üblicher Hardware (USB-Tastatur) funktionieren und das frisch installierte System booten! V.a. bei einer Server-Edition darf sowas nicht passieren, auch dass das System nach korrekt konfigurierter Volume-Modifikation nicht mehr hochfährt, ist für einen Server nicht tragbar. Ich bin froh, dass ich hier einen physischen Zugang zum System habe. Ich bin jedenfalls von der Entwicklung enttäuscht - ich würde gerne auf Spielereien wie GRUB2 und Upstart verzichten (ein Server muss nicht so schnell hochfahren, wenn er das nur alle paar Wochen machen muss), wenn ich dafür ein - wie in den vorherigen Versionen - zuverlässiges und robustes System hätte. Die betreffenden Bug-Reports 360378 und 484677) existieren schon geraume Zeit, lange genug jedenfalls, dass man das in der LTS-Version berücksichtigen könnte...

ArnoW

Avatar von ArnoW

Anmeldungsdatum:
14. November 2009

Beiträge: 1090

Wohnort: Pfalz

Hallo hdz,

zu deinen USB-Problemen bei der Installation kann ich leider nichts beitragen. Deine Erfahrungen mit RAID unter Lucid kann ich aber bestätigen. Ich habe es bisher auch noch nicht geschafft, Software-RAID sauber unter 10.04 zum Laufen zu bringen.

Ich kann dir bis auf weiteres nur raten, eine ältere Version zu verwenden. Bei mir läuft eine recht umfangreiche RAID-Konfiguration unter Karmic (9.10) völlig störungsfrei.

hdz

(Themenstarter)
Avatar von hdz

Anmeldungsdatum:
24. Juni 2006

Beiträge: 88

Wohnort: Bayreuth

Das hab ich anfangs auch schon probiert, obwohl ich gar keine Lust hab, den Spaß in kürzerer Zeit zu wiederholen, weswegen ich die LTS-Version bevorzuge. Der "Gave up waiting for root device"-GRUB2-Feher mit noch nicht vollständig recovered RAID kann aber auch die 9.10 😉

ArnoW

Avatar von ArnoW

Anmeldungsdatum:
14. November 2009

Beiträge: 1090

Wohnort: Pfalz

Dagegen könnte man versuchen, vor dem Neustart mdadm so zu konfigurieren, dass es auch von einem "degraded"-RAID startet:

sudo dpkg-reconfigure mdadm

Sollte theoretisch helfen, wirkt zumindest bei einem aufgrund einer defekten Platte unvollständigen RAID1.

hdz

(Themenstarter)
Avatar von hdz

Anmeldungsdatum:
24. Juni 2006

Beiträge: 88

Wohnort: Bayreuth

Fragt die Installation ja ab, hab ich auch zugelassen. Machts nur eben nicht...

cellok

Anmeldungsdatum:
20. August 2010

Beiträge: 15

Wohnort: Nürnberg

Hi,

http://forum.ubuntuusers.de/topic/dell-t110-ohne-perc-300-mit-mdadm-auf-einem-s/

lese dir das mal durch, hatte ähnliche Probleme... Ubuntu 10.04.1 hat ein Problem mit 500GB Platten und mdadm. Du musst einfach ein paar GB am Ende jeder Festplatte frei lassen. Außerdem kannst du mit allen Grub-Versionen unter 2 nur von einem Raid1 booten , d.h. Raid1 /boot , Raid5 / und swap das geht. Liegt wohl an den Metadaten, einfach 2-3 GB freilassen bei deinem RAID10 /data Viel Glück ☺

hdz

(Themenstarter)
Avatar von hdz

Anmeldungsdatum:
24. Juni 2006

Beiträge: 88

Wohnort: Bayreuth

Ah, danke für den Hinweis! Ich habe das Problem jetzt anders lösen können: bei Installation nur 1 RAID5 mit 4x2GB als / anlegen (GRUB2 kann auch von RAID5 booten) und im laufenden Sysem die 4x498GB als RAID5 anzulegen und das Volume einzubinden. Alles in kleinen Schritten mit regelmäßiger Überprüfung, ob er noch bootet... bis jetzt funktioniert's - und ich weiß nicht warum!

Antworten |