HowTo: VMware vSphere Cluster herunterfahren
In jeder virtualisierten Umgebung sind die Verfügbarkeit und Integrität des VMware vSphere Clusters von größter Relevanz. Während die Robustheit moderner Hardware- und Softwaresysteme das Risiko unerwarteter Ausfälle minimiert, ist es von entscheidender Bedeutung, proaktiv für mögliche Stromausfälle oder Wartungsereignisse zu planen. Dieser Beitrag befasst sich mit dem Stellenwert eines gut durchgeführten VMware Cluster Shutdown, mit möglichen Fallstricken, die es zu beachten gilt, mit der richtigen Reihenfolge beim Herunterfahren virtueller Maschinen und mit den Lösungen, die Ihnen OPMONis hierbei bietet.
Inhalt:
Schützen Sie Ihren VMware Cluster,
bevor der Strom ausfällt!
Warum ist ein geordnetes Herunterfahren bei einem Stromausfall so wichtig?
Es gibt viele Gründe für einen kontrollierten und rechtzeitigen Shutdown
Die Durchführung eines kontrollierten Shutdowns eines VMware Clusters bei einem Stromausfall trägt grundlegend zum Schutz und zur Integrität Ihres Systems bei. Diese Aussage begründet sich auf folgende Tatsachen.
- Datenintegrität: Ein plötzlicher Stromausfall kann zu Datenbeschädigungen und Inkonsistenzen führen. Indem Sie einen ordnungsgemäßen Shutdown einleiten, ermöglichen Sie es den virtuellen Maschinen, ihren Status zu speichern und die Datenintegrität zu gewährleisten.
- Kontinuität der Anwendung: Ein geordnetes Herunterfahren ermöglicht es Anwendungen, laufende Prozesse abzuschließen, die Konsistenz zu wahren und mögliche Serviceunterbrechungen oder Anwendungsfehler bei der Wiederherstellung der Stromversorgung zu vermeiden.
- Hardware-Schutz: Ein rechtzeitiges und kontrolliertes Herunterfahren verringert das Risiko von Schäden an den Hardwarekomponenten.
- Zeitersparnis beim Neustart: Durch einen ordnungsgemäßen Shutdown vermeidet man zeitaufwendige Reparatur- und Wiederherstellungsmaßnahmen von korrupten Dateisystemen oder Datenbanken. Vor allem bei einer großen Zahl an virtuellen Systemen, kann dieser Vorgang zu einer massiven Verzögerung bei der Wiederaufnahme des Betriebs führen.
Die Verwendung einer USV sollte hierbei obligatorisch sein. Weitere Details zum Einsatz einer USV finden Sie im nächsten Abschnitt.
Verwendung einer USV
Die Verwendung einer unterbrechungsfreien Stromversorgung (USV) zur Sicherung eines ESXi-Clusters bietet mehrere Vorteile. Der offensichtliche Schutz vor kurzfristigen Stromausfällen und vor Über- bzw. Unterversorgung. Unterspannungen sind dabei nur ein kleiner Teil der Pluspunkte. Alle weiteren Gründe haben wir hier für Sie zusammengestellt.
- Schutz vor Stromausfällen: Eine USV bietet eine Notstromversorgung bei Stromausfällen oder elektrischen Störungen. Dies hilft, plötzliche Abschaltungen oder Unterbrechungen der ESXi-Hosts und der darauf ausgeführten virtuellen Maschinen zu verhindern. Durch die Sicherstellung einer kontinuierlichen Stromversorgung trägt eine USV zur Aufrechterhaltung der Verfügbarkeit und Betriebszeit des Clusters bei.
- Geregelter Shutdown: Bei einem Stromausfall kann eine USV ein Signal an die ESXi-Hosts senden, um sie über den Stromausfall zu benachrichtigen. Dies ermöglicht den Hosts, ein kontrolliertes, geordnetes Herunterfahren der virtuellen Maschinen zu initiieren. Geordnete Shutdowns helfen dabei, Datenbeschädigungen zu verhindern, die Integrität laufender Anwendungen aufrechtzuerhalten und das Risiko von Datenverlusten zu minimieren.
- Überspannungsschutz und Spannungsregelung: Eine USV umfasst in der Regel Überspannungsschutz- und Spannungsregulierungsfunktionen. Sie hilft, die ESXi-Hosts und andere Infrastrukturkomponenten vor Überspannungen, Spannungsspitzen und Spannungsschwankungen zu schützen. Diese elektrischen Anomalien können Hardwarekomponenten beschädigen und zu Systemausfällen führen. Die USV fungiert als Puffer und versorgt die Cluster-Hardware mit stabiler und geregelter Energie.
- Batterie-Backup-Laufzeit: USV-Systeme sind mit Batterien ausgestattet, die eine gewisse Reservelaufzeit bieten. Dies gibt Ihnen ein Zeitfenster, um auf einen Stromausfall zu reagieren, virtuelle Maschinen ordnungsgemäß herunterzufahren oder sogar ein Notstromaggregat zu starten, falls erforderlich. Die Laufzeit der USV hängt von Faktoren wie der Stromlast, der Batteriekapazität und der Konfiguration ab.
- Datenintegrität und -schutz: Ein plötzlicher Stromausfall kann zur Beschädigung oder zum Verlust von Daten in virtuellen Maschinen und Speichersystemen führen. Durch den Einsatz einer USV können Sie sicherstellen, dass kritische Daten geschützt sind und mögliche Dateninkonsistenzen oder Systemfehler durch plötzliche Stromausfälle vermieden werden.
- Vermeidung von Startüberspannungen: Wenn die Stromversorgung nach einem Stromausfall wiederhergestellt wird, kann es zu einer Überlast kommen, wenn die Geräte gleichzeitig eingeschaltet werden. Dieser Stromstoß kann die Hardwarekomponenten belasten. Eine USV kann dies abmildern, indem sie ein kontrolliertes und allmähliches Einschalten der ESXi-Hosts gewährleistet und so das Risiko von Schäden während des Startvorgangs verringert.
Insgesamt trägt die Verwendung einer USV mit einem ESXi-Cluster zum Schutz vor strombezogenen Problemen bei und gewährleistet die Verfügbarkeit, Integrität und das ordnungsgemäße Herunterfahren von virtuellen Maschinen und Infrastrukturkomponenten. Sie bietet eine zusätzliche Schutzebene und hilft, die Stabilität und Kontinuität Ihrer virtualisierten Umgebung zu erhalten.
VMware vSphere Cluster herunterfahren
Egal ob der Grund nun ein langanhaltender Stromausfall und das resultierende vollständige Entladen der USV Batterie, oder einfach nur Wartungsarbeiten zur Optimierung oder Fehlerbehebungen sind. Wir haben erkannt, dass es wichtige Gründe gibt, sich rechtzeitig und umfassend auf das Thema VMware Cluster Shutdown vorzubereiten. Aus diesem Grund gehen wir hier auf die nötigen Arbeitsschritte, die potenziellen Fallstricke und auf das Thema Reihenfolge und Abhängigkeiten im Detail ein.
Eine Schritt für Schritt Anleitung zum Herunterfahren eines VMware Clusters
Das Herunterfahren eines VMware vSphere Clusters ist zwar im Prinzip nicht kompliziert, um aber unnötige Probleme während des Herunterfahrens oder beim anschließenden Neustart zu vermeiden, muss ein bestimmtes Protokoll eingehalten werden. Da auf einem Cluster meist ein komplexes System mit von einander abhängigen virtuellen Maschinen besteht, kann dieses Protokoll von Anlage zu Anlage variieren. Aus allgemeiner Sicht besteht es aber aus den folgenden Schritten.
- Verbinden Sie sich mit der vCenter Server Verwaltungsschnittstelle, in dem Sie in Ihrem Browser die URL https://Appliance-IP-Adresse-oder-FQDN:5480 öffnen.
- Melden Sie sich mit den entsprechenden Anmeldedaten an.
- Wählen Sie den Cluster in der Inventaransicht aus.
- Führen Sie das Herunterfahren der zugeordneten Virtuellen Maschinen aus, damit diese nicht auf einen anderen Host verschoben werden.
- Navigieren Sie zur Registerkarte “Hosts”.
- Wählen Sie alle Hosts des Clusters aus.
- Klicken Sie mit der rechten Maustaste auf die Auswahl und wählen Sie “Herunterfahren” oder “Wartungsmodus aktivieren”.
- Wenn Sie “Herunterfahren” wählen, werden die Hosts sofort ausgeschaltet.
- Wenn Sie “Wartungsmodus aktivieren” wählen, werden noch laufende virtuelle Maschinen auf andere Hosts im Cluster migriert oder ordnungsgemäß abgeschaltet, wenn keine anderen Hosts zur Aufnahme der virtuellen Maschinen verfügbar sind.
- Fahren sie noch laufende Hosts, die sich jetzt im Wartungsmodus befinden, herunter.
- Bestätigen Sie die Aktion und warten Sie, bis die Hosts heruntergefahren oder in den Wartungsmodus übergegangen sind.
- Sobald die Hosts heruntergefahren oder in den Wartungsmodus übergegangen sind, ist der vSphere Cluster effektiv heruntergefahren.
Im Falle eines Stromausfalls hilft zwar die USV, einen direkten Ausfall der Systeme zu vermeiden. Durch das stetige Entladen der Batterie der USV bleibt aber trotzdem meist wenig Zeit zu reagieren. Daher ist eine Automatisierung der Schritte zum Herunterfahren eines Clusters zwingend notwendig. Wie OPMONis Sie hierbei unterstützt, erfahren Sie im Abschnitt “Einsatz einer Automatisierungs-Software: OPMONis”
Fallstricke des VMware vSphere Shutdown
Das Herunterfahren eines ESXi Clusters ist wie in den beschriebenen Fällen der vorherigen Abschnitte unvermeidbar. Die grundlegenden Schritte und die Abfolge wurden im Detail beschrieben und können als erster Entwurf für ein Protokoll dienen. Bei der Planung und der Erstellung einer individuellen Shutdown-Checkliste Ihres spezifischen VMware Clusters, sollten Sie sich allerdings der folgenden möglichen Fallstricke bewusst sein.
- Falsche Shutdown-Reihenfolge: Virtuelle Maschinen können Abhängigkeiten zu anderen VMs oder Diensten haben. Die Nichteinhaltung der korrekten Shutdown-Reihenfolge kann zu Serviceunterbrechungen oder Datenbeschädigungen führen. Schalten Sie abhängige virtuelle Maschinen vorrangig vor denjenigen ab, die von ihnen abhängen.
- Auswirkungen auf laufende Dienste: Das Herunterfahren eines ESXi-Clusters führt dazu, dass alle virtuellen Maschinen, die auf den Hosts laufen, ausgeschaltet werden. Dies kann zu einer Unterbrechung kritischer Dienste oder Anwendungen führen. Stellen Sie sicher, dass Sie die notwendigen Ausfallzeiten mit den entsprechenden Beteiligten kommuniziert und eingeplant haben.
- Probleme bei der VM-Migration: Wenn Sie sich dafür entscheiden, in den Wartungsmodus zu wechseln, anstatt sofort herunterzufahren, werden die virtuellen Maschinen auf andere Hosts im Cluster migriert. Wenn der Cluster jedoch nicht über genügend Ressourcen verfügt oder wenn es Probleme mit dem Migrationsprozess gibt, kann es sein, dass einige virtuelle Maschinen nicht migriert werden können oder eine Leistungsverschlechterung erfahren.
- Ressourcenverfügbarkeit: Stellen Sie sicher, dass die verbleibenden Hosts im Cluster über genügend Ressourcen (CPU, Arbeitsspeicher, Storage) verfügen, um die virtuellen Maschinen aufzunehmen, die von den stillgelegten Hosts migriert werden. Unzureichende Ressourcen können die Leistung und Verfügbarkeit der migrierten virtuellen Maschinen beeinträchtigen.
- Überlegungen zu Netzwerk und Storage: Vergewissern Sie sich, dass die Netzwerk- und Speicherkonfigurationen während des Shutdowns intakt bleiben. Ungeeignete Konfigurationen können zu Verbindungsproblemen oder Schwierigkeiten beim Zugriff auf Speicherressourcen führen.
- Speicherzugriff: Wenn Ihr Cluster gemeinsamen Speicher verwendet, stellen Sie sicher, dass die verbleibenden Hosts nach dem Herunterfahren des Clusters ordnungsgemäßen Zugriff auf die gemeinsamen Speicherressourcen haben. Überprüfen Sie die Speicherverbindungen und -konfigurationen, um sicherzustellen, dass die virtuellen Maschinen auf die erforderlichen Speicherressourcen zugreifen können.
Wie eine Automatisierung dieser Schritte Sie bei der Vermeidung dieser Fallstricke unterstützt, erfahren Sie im Abschnitt “Einsatz einer Automatisierungs-Software: OPMONis”
Korrekte Reihenfolge und Abhängigkeiten
Im vorherigen Absatz wurden die Fallstricke des VMware Cluster Shutdown detailliert beschrieben. Da sich dieser Themenbereich mit der Ermittlung und Anwendung der korrekten Reihenfolge auf Basis der Abhängigkeiten oft als sehr komplex darstellt, gehen wir hier noch einmal auf die wichtigsten Punkte bei der Analyse und Umsetzung ein.
- Identifizieren Sie Abhängigkeiten: Identifizieren Sie alle voneinander abhängigen virtuellen Maschinen oder Dienste innerhalb des Clusters.
- Priorisieren Sie abhängige VMs: Beginnen Sie damit, die virtuellen Maschinen herunterzufahren, die nicht von anderen Diensten oder virtuellen Maschinen abhängig sind.
- Sequentielles Herunterfahren: Fahren Sie mit dem Herunterfahren der virtuellen Maschinen in einer sequentiellen Weise fort und berücksichtigen Sie dabei die Abhängigkeiten zwischen ihnen. Stellen Sie sicher, dass abhängige Dienste oder virtuelle Maschinen abgeschaltet werden, nachdem ihre Abhängigkeiten sicher heruntergefahren wurden.
- Schließen Sie mit Infrastrukturkomponenten ab: Sobald alle virtuellen Maschinen heruntergefahren sind, fahren Sie mit dem sicheren Herunterfahren des ESXi-Hosts und aller anderen Infrastrukturkomponenten fort.
Wer macht das Licht aus?
Nach der Klärung aller Details für ein Protokoll zum Herunterfahren Ihres VMware Clusters bleibt noch die Frage offen, wer am Ende als letzte Instanz übrigbleibt, beziehungsweise. wer das letzte System mit den meisten Abhängigkeiten beendet. In der Praxis ist das meist ein zentraler Speicher, bei dem es selbsterklärend ist, dass auch dieser ordnungsgemäß heruntergefahren werden muss.
Im Folgenden finden Sie hier mehrere Ansätze mit einer Beschreibung der Abhängigkeit des Beendens bei der Verwendung einer Automatisierungs-Software und eines Storage.
- Speicher mit Verzögerung herunterfahren: Nach dem alle abhängigen Systeme beendet wurden, bleiben nur noch die Instanz der Automatisierungssoftware und das Storage-System übrig. Die Automatisierung setzt über die vom Hersteller angebotene Schnittstelle (bzw. über ein externes Script) den Shutdown-Befehl für den Storage mit Zeitverzögerung ab und beendet sich anschließend selbst. Nach Ablauf der Zeitverzögerung fährt das Storage-System herunter.
- Eigene Hardware für die Automatisierungs-Software: Die Automatisierungs-Software läuft auf einem System mit dedizierter Hardware (Baremetal) und einer eigenen Festplatte. Hierdurch kann die Automatisierung den Storage-Shutdown einleiten und überwachen und sich am Ende selbst herunterfahren.
- Eigenheiten der Storage-Systeme beachten: Prinzipiell ist es nicht möglich, eine allgemeingültige Empfehlung für die Vorgehensweise und den Zeitpunkt des Storage-Shutdowns zu geben. Hierbei hängen zu viele Kriterien von der konkreten technischen Umsetzung des Storage-Systems der verschiedenen Hersteller ab.
Sie sind auf der Suche nach einer Lösung für dieses Problem und haben noch offene Fragen?
Wir unterstützen Sie hier gerne, eine passende Lösung für Ihre individuelle Situation zu finden.
Einsatz einer Automatisierungs-Software: OPMONis
Eine Automatisierungs-Software muss auch die USV überwachen und bei einem Stromausfall die Systemlandschaft rechtzeitig und geordnet herunterfahren. Hieraus ergeben sich folgende Anforderungslisten an die Automatisierungssoftware:
- Überwachung einer bzw. mehrere USVs
- Unabhängigkeit durch die Unterstützung verschiedener USV-Hersteller bzw.. auch das Mischen von USV-Herstellern
- Skalierbarkeit durch die Unterstützung einer heterogenen Systemlandschaft mit einer großen Anzahl von Systemen
- Unterstützung eines VMware vSphere Clusters, sowohl für die virtuellen Maschinen als auch für die Knoten (ESXi Hosts) des Clusters
- Automatisches und rechtzeitiges Herunterfahren (Abhängig von der USV-Restlaufzeit oder Kapazität)
- Beachtung der Abhängigkeiten in der Shutdown-Reihenfolge
- Zuverlässigkeit durch das Warten und Prüfen auf einen vollständigen Shutdown, sowie eine Fehlerbehandlung beim Herunterfahren, damit ein einzelnes System nicht den Gesamtprozess blockieren kann
- Übersichtliche Darstellung der Shutdown-Konfiguration für den Benutzer
- Verschlüsselte Speicherung aller sicherheitskritischen Informationen wie Benutzer, Passwort und Skript-Inhalte
OPMONis bietet Ihnen eine Lösung für alle genannten Punkte!
OPMONis: Schritt für Schritt Erklärvideo zur Konfiguration eines VMware Clusters
In diesem Video zeigen wir Ihnen eine Schritt für Schritt Anleitung, wie Sie in OPMONis ein Netzwerk-USV und einen VMware Cluster konfigurieren.
Kostenlose 14 Tage Testversion
Überzeugen Sie sich selbst und holen Sie sich noch heute Ihre kostenfreie 14 Tage Testversion.
Kontakt
Sie haben noch weiterführende Fragen zu diesem Thema oder möchten sich konkret dazu beraten lassen, wie Ihnen OPMONis in Ihrer konkreten Situation weiterhelfen können?