Disk Heartbeat

Für OCFS2 müssen die Knoten im Netzwerk "alive" (betriebsbereit und online) sein. Um sicherzustellen, dass dies auch der Fall ist, sendet der O2CB-Cluster-Dienst in regelmäßigen Abständen so genannte Keepalive-Pakete. Der Cluster-Dienst verwendet dazu statt des LAN eine private Verbindung zwischen den Knoten, um zu verhindern, dass eventuelle Netzwerkverzögerungen als verschwundener Knoten interpretiert werden, was einer Selbstabriegelung des Knotens gleichkommen würde.

Der OC2B-Cluster-Dienst kommuniziert den Knotenstatus über ein Disk Heartbeat. Die Heartbeat-Systemdatei befindet sich auf dem Storage Area Network (SAN), wo sie allen Knoten des Clusters zur Verfügung steht. Die Blockzuweisungen der Datei entsprechen der Reihenfolge nach den Steckplatz-Zuweisungen der einzelnen Knoten.

Jeder Knoten liest die Datei in Zwei-Sekunden-Intervallen und schreibt in den ihm zugewiesenen Block. Änderungen am Zeitstempel eines Knotens sind ein Hinweis darauf, dass der Knoten betriebsbereit ist. Als "tot" wird ein Knoten bezeichnet, wenn er über eine bestimmte Anzahl an Intervallen (dem Heartbeat-Schwellenwert) nicht mehr in die Heartbeat-Datei schreibt. Selbst wenn nur ein einziger Knoten "alive" ist, muss der O2CB-Cluster-Dienst diese Überprüfung durchführen, da jederzeit ein anderer Knoten dynamisch hinzugefügt werden kann.

Den Disk Heartbeat-Schwellenwert können Sie in der Datei /etc/sysconfig/o2cb mit dem Parameter O2CB_HEARTBEAT_THRESHOLD ändern. Die Wartezeit berechnet sich wie folgt:

(O2CB_HEARTBEAT_THRESHOLD value - 1) * 2 = threshold in seconds

Wenn beispielsweise für O2CB_HEARTBEAT_THRESHOLD der Standardwert 7 eingestellt ist, beträgt die Wartezeit 12 Sekunden ((7 - 1) * 2 = 12).