Inhaltsverzeichnis
Zusammenfassung
In diesem Kapitel erhalten Sie eine kurze Übersicht über die grundlegenden Konzepte und Werkzeuge für eine hohe Verfügbarkeit unter Linux. Außerdem erhalten Sie zu allen erläuterten Themen Hinweise zu weiteren Publikationen.
Hohe Verfügbarkeit bedeutet, dass Systeme bestimmte Fehlfunktionen überwinden können. Damit sind vor allem Ausfälle einzelner Computer gemeint. Der Dienst steht nach nur kurzer Ausfallzeit wieder für den Benutzer zur Verfügung. Hardware und Software sind sorgfältig aufeinander abgestimmt und in Bezug auf Redundanz optimiert. So ist bei einem Ausfall ein automatischer Wechsel zu anderen Komponenten möglich. Die Bezeichnung „Hohe Verfügbarkeit“ unterscheidet sich von der „Fehlertoleranz“, da der Dienst kurzfristig für die Zeit des Umschaltens nicht verfügbar ist. Das macht sich in Verzögerungen oder kurzen Verbindungsverlusten bemerkbar.
Ein System mit hoher Verfügbarkeit bedeutet, dass die Gesamtverfügbarkeit des Dienstes zwischen 99,999 Prozent und 99,99999 liegt. Das entspricht einer Ausfallzeit von drei Sekunden bis fünf Minuten in einem ganzen Jahr. Der wichtigste Faktor ist nicht nur die Software und Hardware, sondern vor allem eine gut geplante Systemadministration mit gut dokumentierten und verständlichen Prozessen zur Fehlerbeschränkung. Dabei müssen Risiken und Kosten stets abgewägt werden. Verschiedene Anforderungen und Lösungen sind eventuell erforderlich, je nach dem Anwendungsszenario. Ihr Novell-Partner berät Sie gerne.
Im Folgenden sehen Sie einige wichtige Begriffe zur hohen Verfügbarkeit:
Single Point of Failure: Systemkomponente, deren Ausfall die Funktion des ganzen Systems behindert.
Eine ähnliche Systemkomponente übernimmt automatisch die Funktion der ausgefallenen Komponente.
Die alternative Hardware befindet sich im Cold-Standby-Modus. Der Failover muss manuell durchgeführt werden. So wird der Fehler deutlich bemerkbar.
Das Backup-System wird im Hintergrund ausgeführt. Der Wechsel findet automatisch statt. Die Daten beider Systeme werden automatisch synchronisiert. Für den Benutzer wird der Failover als sehr schneller automatischer Neustart eines Diensts sichtbar. Der aktuelle Vorgang wird jedoch eventuell abgebrochen, weil eine Synchronisierung der Daten vor dem Fehler nicht möglich war.
Beide Systeme werden ständig parallel ausgeführt. Die Daten auf beiden Systemen sind hundertprozentig synchronisiert. Der Benutzer bemerkt keinen Ausfall. Diese Stufe kann gewöhnlich nicht erreicht werden, ohne eine entsprechende Änderung am Client vorzunehmen. Sollen beide Systeme komplett synchron ausgeführt werden, müssen die Verbindungen mit dem Client hundertprozentig gespiegelt werden. Das erfordert meist, dass die Clients mit zwei oder mehr Servern gleichzeitig verbunden sind und mit allen kommunizieren. Ein gewöhnlicher Webbrowser genügt hierfür nicht.
Die Verteilung der Belastung in einem Cluster von Computern. Der Belastungsausgleich wird beispielsweise in einem LVS-Szenario (Linux Virtual-Server) verwendet (siehe Abschnitt 12.5.2, „Linux Virtual Server“).
Shot the other node in the head: Spezielle Hard- und Software, die sicherstellt, dass ein fehlerhafter Knoten keinen Schreibzugriff auf verteilte Medien in einem Cluster hat und so die Datenkonsistenz im gesamten Cluster gefährdet. Das bedeutet, dass das System einfach von der Stromversorgung getrennt wird.