Kapitel 12. Hohe Verfügbarkeit (High Availability) unter Linux

Inhaltsverzeichnis

12.1. Wichtige Begriffe
12.2. Ein Mindestszenario als Beispiel
12.3. Komponenten einer Lösung mit hoher Verfügbarkeit
12.4. Software-Anforderungen bei hoher Verfügbarkeit
12.5. Clustering
12.6. Weitere Informationen

Zusammenfassung

In diesem Kapitel erhalten Sie eine kurze Übersicht über die grundlegenden Konzepte und Werkzeuge für eine hohe Verfügbarkeit unter Linux. Außerdem erhalten Sie zu allen erläuterten Themen Hinweise zu weiteren Publikationen.

Hohe Verfügbarkeit bedeutet, dass Systeme bestimmte Fehlfunktionen überwinden können. Damit sind vor allem Ausfälle einzelner Computer gemeint. Der Dienst steht nach nur kurzer Ausfallzeit wieder für den Benutzer zur Verfügung. Hardware und Software sind sorgfältig aufeinander abgestimmt und in Bezug auf Redundanz optimiert. So ist bei einem Ausfall ein automatischer Wechsel zu anderen Komponenten möglich. Die Bezeichnung „Hohe Verfügbarkeit“ unterscheidet sich von der „Fehlertoleranz“, da der Dienst kurzfristig für die Zeit des Umschaltens nicht verfügbar ist. Das macht sich in Verzögerungen oder kurzen Verbindungsverlusten bemerkbar.

Ein System mit hoher Verfügbarkeit bedeutet, dass die Gesamtverfügbarkeit des Dienstes zwischen 99,999 Prozent und 99,99999 liegt. Das entspricht einer Ausfallzeit von drei Sekunden bis fünf Minuten in einem ganzen Jahr. Der wichtigste Faktor ist nicht nur die Software und Hardware, sondern vor allem eine gut geplante Systemadministration mit gut dokumentierten und verständlichen Prozessen zur Fehlerbeschränkung. Dabei müssen Risiken und Kosten stets abgewägt werden. Verschiedene Anforderungen und Lösungen sind eventuell erforderlich, je nach dem Anwendungsszenario. Ihr Novell-Partner berät Sie gerne.

12.1. Wichtige Begriffe

Im Folgenden sehen Sie einige wichtige Begriffe zur hohen Verfügbarkeit:

SPOF

Single Point of Failure: Systemkomponente, deren Ausfall die Funktion des ganzen Systems behindert.

Failover

Eine ähnliche Systemkomponente übernimmt automatisch die Funktion der ausgefallenen Komponente.

Cold-Standby

Die alternative Hardware befindet sich im Cold-Standby-Modus. Der Failover muss manuell durchgeführt werden. So wird der Fehler deutlich bemerkbar.

Warm-Standby

Das Backup-System wird im Hintergrund ausgeführt. Der Wechsel findet automatisch statt. Die Daten beider Systeme werden automatisch synchronisiert. Für den Benutzer wird der Failover als sehr schneller automatischer Neustart eines Diensts sichtbar. Der aktuelle Vorgang wird jedoch eventuell abgebrochen, weil eine Synchronisierung der Daten vor dem Fehler nicht möglich war.

Hot-Standby

Beide Systeme werden ständig parallel ausgeführt. Die Daten auf beiden Systemen sind hundertprozentig synchronisiert. Der Benutzer bemerkt keinen Ausfall. Diese Stufe kann gewöhnlich nicht erreicht werden, ohne eine entsprechende Änderung am Client vorzunehmen. Sollen beide Systeme komplett synchron ausgeführt werden, müssen die Verbindungen mit dem Client hundertprozentig gespiegelt werden. Das erfordert meist, dass die Clients mit zwei oder mehr Servern gleichzeitig verbunden sind und mit allen kommunizieren. Ein gewöhnlicher Webbrowser genügt hierfür nicht.

Belastungsausgleich

Die Verteilung der Belastung in einem Cluster von Computern. Der Belastungsausgleich wird beispielsweise in einem LVS-Szenario (Linux Virtual-Server) verwendet (siehe Abschnitt 12.5.2, „Linux Virtual Server“).

STONITH

Shot the other node in the head: Spezielle Hard- und Software, die sicherstellt, dass ein fehlerhafter Knoten keinen Schreibzugriff auf verteilte Medien in einem Cluster hat und so die Datenkonsistenz im gesamten Cluster gefährdet. Das bedeutet, dass das System einfach von der Stromversorgung getrennt wird.