Hallo,
ich habe auf meinem Computer mittels VirtualBox zwei virtuelle Maschinen aufgesetzt (jeweils Ubuntu 14.04.1 LTS) und möchte mit diesen beiden System ein kleines Cluster realisieren, dass hoch verfügbar sein soll.
Ich habe auf beiden Maschinen DRBD eingerichtet. Die Synchronisation funktioniert auch soweit sehr gut. Beide Maschinen sprechen sich an und je nach dem, welche Maschine ich als Primary bzw Secondary schalte, kann ich dann auf die Daten zugreifen bzw. auch Daten hinterlegen, die dann auf der anderen Seite wiederum abgerufen werden können (Natürlich erst nach Primary-Secoundary switch)
Als nächstes würde ich gerne eine Redundanz mit pacemaker und corosync realisieren. Wenn angenommen eine Maschine abgeschaltet wird, muss DRBD auf der anderen Maschine sich sofort und automatisch als Primary umschalten und die virtuelle Festplatte mounten.
Das ganze habe ich jeweils mittels folgender Anleitungen versucht aufzubauen:
DRBD mit dieser Anleitung → https://help.ubuntu.com/10.04/serverguide/drbd.html
Pacemaker/Corosync mit diesen beiden → https://andi.priv.at/2011/07/27/debian-squeeze-drbd-pacemaker-tutorial/ und https://wiki.ubuntu.com/ClusterStack/Natty
Ab dem Schritt wo ich "crm_mon" aufrufe bzw. "crm_mon --one-shot -V" bekomme ich prompt folgenden Fehler gemeldet:
Could not establish cib_ro connection: Connection refused (111) Connection to cluster failed: Transport endpoint is not connected
komischerweise aber steht im syslog folgendes:
Sep 19 15:40:13 ubuntu2 corosync[877]: [MAIN ] Corosync Cluster Engine ('2.3.3'): started and ready to provide service. Sep 19 15:40:13 ubuntu2 corosync[877]: [MAIN ] Corosync built-in features: dbus testagents rdma watchdog augeas pie relro bindnow Sep 19 15:40:13 ubuntu2 corosync[898]: [TOTEM ] Initializing transport (UDP/IP Multicast). Sep 19 15:40:13 ubuntu2 corosync[898]: [TOTEM ] Initializing transmit/receive security (NSS) crypto: none hash: none Sep 19 15:40:13 ubuntu2 corosync[898]: [TOTEM ] The network interface [172.20.23.172] is now up. Sep 19 15:40:13 ubuntu2 corosync[898]: [SERV ] Service engine loaded: corosync configuration map access [0] Sep 19 15:40:13 ubuntu2 corosync[898]: [QB ] server name: cmap Sep 19 15:40:13 ubuntu2 corosync[898]: [SERV ] Service engine loaded: corosync configuration service [1] Sep 19 15:40:13 ubuntu2 corosync[898]: [QB ] server name: cfg Sep 19 15:40:13 ubuntu2 corosync[898]: [SERV ] Service engine loaded: corosync cluster closed process group service v1.01 [2] Sep 19 15:40:13 ubuntu2 corosync[898]: [QB ] server name: cpg Sep 19 15:40:13 ubuntu2 corosync[898]: [SERV ] Service engine loaded: corosync profile loading service [4] Sep 19 15:40:13 ubuntu2 corosync[898]: [WD ] No Watchdog, try modprobe <a watchdog> Sep 19 15:40:13 ubuntu2 corosync[898]: [WD ] no resources configured. Sep 19 15:40:13 ubuntu2 corosync[898]: [SERV ] Service engine loaded: corosync watchdog service [7] Sep 19 15:40:13 ubuntu2 corosync[898]: [QUORUM] Using quorum provider corosync_votequorum Sep 19 15:40:13 ubuntu2 corosync[898]: [QUORUM] This node is within the primary component and will provide service. Sep 19 15:40:13 ubuntu2 corosync[898]: [QUORUM] Members[0]: Sep 19 15:40:13 ubuntu2 corosync[898]: [SERV ] Service engine loaded: corosync vote quorum service v1.0 [5] Sep 19 15:40:13 ubuntu2 corosync[898]: [QB ] server name: votequorum Sep 19 15:40:13 ubuntu2 corosync[898]: [SERV ] Service engine loaded: corosync cluster quorum service v0.1 [3] Sep 19 15:40:13 ubuntu2 corosync[898]: [QB ] server name: quorum Sep 19 15:40:13 ubuntu2 corosync[898]: [TOTEM ] A new membership (172.20.23.172:36) was formed. Members joined: 739514284 Sep 19 15:40:13 ubuntu2 corosync[898]: [QUORUM] Members[1]: 739514284 Sep 19 15:40:13 ubuntu2 corosync[898]: [MAIN ] Completed service synchronization, ready to provide service. Sep 19 15:40:13 ubuntu2 corosync[898]: [TOTEM ] A new membership (172.20.23.150:40) was formed. Members joined: 739514262 Sep 19 15:40:13 ubuntu2 corosync[898]: [QUORUM] Members[2]: 739514262 739514284 Sep 19 15:40:13 ubuntu2 corosync[898]: [MAIN ] Completed service synchronization, ready to provide service.
Es scheint also soweit alles zu funktionieren. Beide Maschinen kommunizieren miteinander. Aber ich kann keine weiteren Einstellungen machen, weil crm ständig nur diesen Fehler ausgibt.
Hier noch die Configuration von Corosync:
# Please read the openais.conf.5 manual page totem { version: 2 # How long before declaring a token lost (ms) token: 3000 # How many token retransmits before forming a new configuration token_retransmits_before_loss_const: 10 # How long to wait for join messages in the membership protocol (ms) join: 60 # How long to wait for consensus to be achieved before starting a new round of membership configuration (ms) consensus: 3600 # Turn off the virtual synchrony filter vsftype: none # Number of messages that may be sent by one processor on receipt of the token max_messages: 20 # Limit generated nodeids to 31-bits (positive signed integers) clear_node_high_bit: yes # Disable encryption secauth: off # How many threads to use for encryption/decryption threads: 0 # Optionally assign a fixed node id (integer) # nodeid: 1234 # This specifies the mode of redundant ring, which may be none, active, or passive. rrp_mode: none interface { # The following values need to be set based on your environment ringnumber: 0 bindnetaddr: 172.20.23.0 mcastaddr: 226.94.1.1 mcastport: 5405 } } amf { mode: disabled } quorum { # Quorum for the Pacemaker Cluster Resource Manager provider: corosync_votequorum expected_votes: 1 } aisexec { user: root group: root } logging { fileline: off to_stderr: yes to_logfile: no to_syslog: yes syslog_facility: daemon debug: off timestamp: on logger_subsys { subsys: AMF debug: on tags: enter|leave|trace1|trace2|trace3|trace4|trace6 } }
Auf beiden Maschinen jeweils gleich.
Hat jemand einen Tipp, woran es liegen könnte?