Ja das hab ich auch verstanden, aber sollte nicht der Secondary Node diesen Zustnd merken und automatisch zum Primary werden?
Dafür ist ja Pacemaker zuständig. Das ist the brain des ganzen Clusters.
Nur ist es eben so, dass ein Reboot alle laufenden Prozesse mehr oder weniger killt. Dazu gehört dann eben auch Pacemaker. Wenn nun also der primary Node einfach abgeschossen wird, was einem reboot oder einem einfachen ausschalten gleich kommt, dann zieht man ja quasi einen Node aus Pacemaker komplett ab. Der noch funktionierende Teil des Ganzen erkennt das und schaltet sich von secondary zu primary - natürlich auch nur dann, wenn das so konfigueriert wurde.
Jetzt ist also der ehemals secondary Node primary und der ehemalige primary Node, kommt nach einem reboot zurück - und hat eben als letzte Information hinterlegt, dass er zuletzt primary war. Wer hat also nun recht? Aus diesem Grund - hatte ich auch bereits geschrieben - darf ein neu gestarteter Node erstmal keinerlei Verbindung automatisch herstellen, denn das kann Matsch geben 😉
Hab es laut "cat /proc/drbd auch wieder Primary/Secondary & UPtoDate/UPtoDate aber wenn ich jetzt per "crm node standby" und "crm node online" den Status der Nodes "wechsel" sind die DRBD-Resourcen kann nicht syncronisiert. Hast du ne Idee woran das liegen könnte?
Split brain 😉 Ich würde crm auf beiden Systemen abschalten. Merke Dir aber, wer der primary der beiden war/ist. Dann startest Du DRBD von hand an und lässt die Platten synchronisieren. So dass das alles wieder passt. Schalte auch mal um, so dass Du wirklich sehen kannst, dass auf beiden Systemen alles ordentlich funktioniert.
Dann erinnerst Du Dich an den letzten Schaltzustand von Pacemaker und stellst genau den DRBD Knoten auf primary, der auch bei Pacemaker primary war, bevor abgeschalten wurde. Danach stoppst Du DRDB, zur Not zuerst den secondary, dann den primary Knoten. Und wenn Du jetzt Pacemaker wieder startest, sollte es passen. Ansonsten eben ausprobieren - so lernt man am meissten. 😉
Failed actions: drbd_monitor_0 (node=dnslab-02, call=8, rc=6, status=complete): not configured drbd_monitor_0 (node=dnslab-01, call=8, rc=6, status=complete): not configured
Dieses "not configured" irritiert mich auch ein wenig. Das klingt nicht gut 😀
Ist nur eine Warnung/Hinweis, kein Fehler. Ich meine zu der Monitor-Geschichte auch im Buch was gelesen zu haben.