Was ist Hochverfügbarkeit? Ein Leitfaden für Einsteiger -

Veröffentlicht am: 16. Oktober 202411,1 min readTags: high availability, redundancy, resiliency, storage, stretch cluster

Was ist Hochverfügbarkeit?

Hochverfügbarkeit (HA) bezieht sich auf die Fähigkeit eines Systems, einen unterbrechungsfreien Betrieb und Zugriff zu gewährleisten, in der Regel gemessen als Prozentsatz der Betriebszeit. Geringere Ausfallzeiten, die Eliminierung einzelner Fehlerquellen und die Replikation und Verteilung von Daten über mehrere Standorte hinweg tragen alle zur Schaffung einer hochverfügbaren Architektur bei.

Wie wird die Hochverfügbarkeit gemessen?

Die Hochverfügbarkeit wird als Prozentsatz der Betriebszeit gemessen und ist in der Regel in einem Service Level Agreement (SLA) enthalten. Wenn eine Lösung ausfallsicher ist, erreicht sie einen Verfügbarkeitswert von 100%. Die Verfügbarkeit wird oft durch die Anzahl der Neunen (9) ausgedrückt, die ein System oder eine Anwendung hat. Die folgende Tabelle enthält ein Beispiel für Verfügbarkeitsstufen und damit verbundene Ausfallzeiten.

AVAL (# von 9s)	AVAL (%)	DT / Jahr	DT / Monat
1	90%	36,5 Tage	72 Stunden
2	99%	3.65 Tage	7.2 Stunden
3	99.9%	8.76 Stunden	43.8 Minuten
4	99.99%	52.56 Minuten	4.38 Minuten
5	99.999%	5.26 Minuten	25,9 Sekunden
6	99.9999%	31,5 Sekunden	2.59 Sekunden

AVAL – Verfügbarkeit
DT – Ausfallzeit

IT-Teams verwenden diese Metriken, um die Systemverfügbarkeit zu planen, während Service Provider sie anwenden, um Service Levels in Service Level Agreements (SLAs) zu garantieren, die die Erwartungen an den Service, einschließlich der Verfügbarkeit, umreißen. Es ist wichtig zu verstehen, dass HA-Kennzahlen unterschiedlich interpretiert werden können, da Benutzer ein System trotz teilweiser Funktionalität aufgrund von Leistungsproblemen als unbrauchbar ansehen können.

Verfügbarkeit (Anzahl von 9s)	Verfügbarkeit (%)	Ausfallzeit pro Jahr	Ausfallzeit pro Monat
1	90%	36,5 Tage	72 Stunden
2	99%	3.65 Tage	7.2 Stunden
3	99.9%	8.76 Stunden	43.8 Minuten
4	99.99%	52.56 Minuten	4.38 Minuten
5	99.999%	5.26 Minuten	25,9 Sekunden
6	99.9999%	31,5 Sekunden	2.59 Sekunden

Wie funktioniert die Hochverfügbarkeit?

Um sicherzustellen, dass IT-Systeme hochverfügbar sind, ist es wichtig, die notwendigen Ausfallsicherheits- und Redundanzniveaus von Anfang bis Ende in die Architekturen einzubauen. Sehen wir uns an, was Ausfallsicherheit und Redundanz sind.

Hohe Verfügbarkeit und Ausfallsicherheit

Resilienz bezieht sich auf die Fähigkeit eines Systems, Betriebsunterbrechungen zu überstehen oder sich von ihnen zu erholen, und wird durch den Einbau von Redundanz in eine Lösung erreicht.

Hohe Verfügbarkeit und Redundanz

Redundanz beschreibt die Einbeziehung zusätzlicher Komponenten (d.h. Hardware und Software) in eine Infrastruktur und die Replikation von Daten zwischen verschiedenen Standorten. Diese Praktiken stellen sicher, dass ein System auch im Falle eines Komponentenausfalls weiterhin funktioniert. Sie sorgen auch dafür, dass der Zugriff auf die Daten jederzeit und von jedem Ort aus möglich ist.

Nehmen wir an, ein Produktionsunternehmen erleidet einen Festplattenausfall in einem Knoten seines hochverfügbaren Clusters. Da es weitere Knoten im Cluster gibt, die exakte Kopien der Daten des ausgefallenen Knotens enthalten, ist das Unternehmen nicht beeinträchtigt. Die Anwendungen können ohne Unterbrechung auf die verbleibenden Betriebsknoten migriert oder neu gestartet werden, und die Produktionslinien des Unternehmens laufen weiter, als wäre nichts geschehen. Das Unternehmen baute ein belastbares System für hohe Verfügbarkeit auf, indem es redundante Serverknoten bereitstellte, die die Geschäftskontinuität nach einer Störung aufrechterhalten.

Was sind Hochverfügbarkeitscluster?

In einem Hochverfügbarkeitssystem werden Server in Clustern eingerichtet und in einer abgestuften Architektur organisiert, um auf Anfragen von Lastverteilern zu reagieren. Wenn ein Server in einem Cluster ausfällt, übernimmt ein anderer Server die Arbeitslast und minimiert so die Auswirkungen auf die Leistung oder die Servicebereitstellung. Diese Redundanz ermöglicht ein Failover auf eine sekundäre Komponente, die die Arbeitslast übernimmt, wenn die primäre Komponente ausfällt.

Je komplexer die Systeme werden, desto schwieriger wird es, HA zu gewährleisten, da es immer mehr potenzielle Fehlerpunkte gibt.

High Availability (HA): One Node Offline

Was sind die Vorteile von Hochverfügbarkeit?

Reduzierte Ausfallzeiten

Heutzutage sind Unternehmen im Tagesgeschäft in hohem Maße von der Technologie abhängig. Wenn ein Server für Wartungsarbeiten, Updates oder Reparaturen vom Netz genommen werden muss, sind die Geschäftsabläufe oft beeinträchtigt. Die Erweiterung Ihrer Infrastruktur um Hochverfügbarkeit ist wie eine Versicherungspolice, die Ihr Unternehmen vor störenden Ausfallzeiten schützt.

Beispiel: Ausfall eines Knotens
Wenn ein Knoten ausfällt oder offline genommen wird, bleiben die anderen betriebsbereit, so dass Ihre Mitarbeiter weiterarbeiten können. So vermeiden Sie nicht nur Produktivitätsverluste, sondern auch Umsatzeinbußen. Die Verwendung fortschrittlicher Hypervisor-Funktionen kann auch sicherstellen, dass Anwendungen keine Ausfallzeiten erleiden, wenn sie auf einem ausgefallenen Knoten laufen.

Geschäftskontinuität und Disaster Recovery

Hochverfügbarkeit hilft Ihrem Unternehmen, auch bei physischen Störungen und Naturkatastrophen widerstandsfähig zu bleiben. Durch die Eliminierung einzelner Fehlerquellen und das Hinzufügen von Redundanzen zu Ihrer Infrastruktur bleibt Ihr System auch dann betriebsbereit, wenn eine Komponente, z. B. ein Serverknoten, offline geht. Stretch-Cluster erfüllen ebenfalls diesen Zweck. Sie ermöglichen es Ihnen, Knoten an zwei oder mehr verschiedenen physischen Standorten zu installieren, so dass die anderen betriebsbereit bleiben, wenn einer davon ausfällt. Erfahren Sie mehr über die Vorteile von Stretch-Clustern in diesem White Paper.

Beispiel: Single Points of Failure
Ein Single Point of Failure kann Ihre IT-Infrastruktur gefährden, wenn es zu physischen Unterbrechungen kommt, z.B. bei einer Naturkatastrophe. Stretch-Cluster beseitigen dieses Risiko, da Ihre Knoten über Ihr Büro, Ihren Campus oder sogar die ganze Stadt verteilt sein können. Darüber hinaus bedeutet HA, dass Ihre IT-Infrastruktur selbst dann funktionsfähig bleibt, wenn ein Serverknoten in dem betroffenen Gebiet offline geht.

Leistung

Die Hochverfügbarkeitsarchitektur ermöglicht die Verteilung von Anwendungen auf die Knoten eines Clusters. Dies verbessert die Rechenleistung, da Ihr Unternehmen die zusätzlichen Ressourcen mehrerer Knoten nutzen kann, während gleichzeitig Speicher-HA gewährleistet ist. Dies wird manchmal auch als Lastausgleich bezeichnet. Eine weitere Konfigurationsmöglichkeit besteht darin, einen reinen HA-Speichercluster zu erstellen, der dann den gespiegelten Speicher an die reinen Rechenknoten weitergibt, die die Anwendungsworkloads verarbeiten. Lesen Sie hier mehr über reine Speichercluster.

Beispiel: Zusätzliche Ressourcen
Wenn Ihre Ressourcen knapp sind, ermöglicht die HA-Architektur die Verteilung von Anwendungen auf die Knoten in einem Cluster, so dass es nicht zu einer Verlangsamung kommt. So werden die verfügbaren Ressourcen Ihres Systems optimal genutzt und die Leistung verbessert.

White Paper: Aufbau eines hochverfügbaren Systems

Anleitungen und bewährte Verfahren zur Gewährleistung einer Hochverfügbarkeitslösung

LESEN SIE MEHR

Hochverfügbarkeitslösungen und Edge Computing

Organisationen, die eine Edge-Umgebung betreiben, egal ob KMU oder Unternehmen, haben oft einzigartige Anforderungen. Dazu gehören:

Mehrere Standorte
Abgelegene Orte
Betriebsumgebungen mit schlechter Netzwerkkonnektivität

In Edge-Umgebungen ist nicht immer IT-Personal vor Ort, um Probleme zu beheben, sobald sie auftreten. Und wenn Probleme auftreten, kann es Stunden oder sogar Tage dauern, bis sie behoben sind, was zu Produktivitäts- und Umsatzeinbußen führt.

In diesen Umgebungen ist eine hohe Verfügbarkeit wichtig, um die IT-Systeme betriebsbereit zu halten und den Geschäftsbetrieb aufrechtzuerhalten.

Wenn Sie mit diesen Einschränkungen konfrontiert sind, müssen Sie sicherstellen, dass Ihre IT-Infrastruktur so widerstandsfähig und zuverlässig wie möglich ist. Wenn z.B. ein Server beschädigt wird oder gewartet werden muss, müssen Sie eine Versicherungspolice (zusätzlicher Knotenpunkt) abschließen, um sicherzustellen, dass Ihr gesamtes System nicht ausfällt, sondern weiterläuft.

Hier sind zwei Beispiele für Edge-Umgebungen, die von der Implementierung einer HA-Architektur profitiert haben.

Hohe Verfügbarkeit auf Flughäfen

Wie stellen die Flughäfen sicher, dass ihre IT-Systeme hochverfügbar sind? Diese Infografik zeigt zwei Beispiele auf.

LESEN SIE MEHR

Windturbinenpark

Eines der größten Energieunternehmen der Welt verfügt über Hunderte von Windkraftanlagen, die ständig verwaltet werden müssen. Wenn kein Wind weht und sich die Flügel der einzelnen Turbinen nicht mehr drehen, kann das Gewicht der Flügel teure Schäden an den Wellen der Turbinen verursachen. Die Software, die dafür sorgt, dass sich die Flügel auch bei Windstille weiterdrehen, muss also unbedingt am Netz bleiben. Angesichts ihrer abgelegenen Lage kann es bis zu sechs Tage dauern, bis ein Techniker eine Reparatur durchführt. Um lange Ausfallzeiten zu vermeiden und Schäden an den Turbinen zu verhindern, benötigte das Unternehmen eine Lösung, die eine hohe Verfügbarkeit ermöglicht. Mehr erfahren Sie in unserer Kundenfallstudie.

US-weite Einzelhandelskette

Eine bekannte Einzelhandelskette in den USA verzeichnete Umsatzeinbußen aufgrund von Systemausfällen. Im Durchschnitt kam es zu 100 Ausfällen pro Jahr und 6 Stunden Ausfallzeit pro Ausfall, was das Geschäft stark beeinträchtigte. Jedes Mal, wenn das System einer Filiale ausfiel, verlor sie Stunden an Produktivität, Kundenbindung und Umsatz. Das Unternehmen benötigte eine Hochverfügbarkeitslösung, um Ausfallzeiten und den Bedarf an Vor-Ort-Support zu vermeiden und die Geschäftskontinuität in mehr als 2.000 Filialen aufrechtzuerhalten. Lesen Sie unsere Kundenfallstudie für weitere Informationen.

HA-Lösungen sind ideal für Edge-Computing-Umgebungen, denn sie helfen ihnen, Ausfallzeiten zu vermeiden und den Betrieb aufrechtzuerhalten. Dies ist besonders für Unternehmen von Vorteil, die nicht über das nötige IT-Personal verfügen, um ihre Systeme zu betreuen.

Möchten Sie mehr darüber erfahren, was eine „Edge“-Umgebung ausmacht? Entdecken Sie unseren Leitfaden für Einsteiger in Edge Computing.

Die Kosteneffektivität von HA in Edge-Umgebungen

Die Implementierung von Hochverfügbarkeit kann die Kosteneffizienz in Edge-Umgebungen erheblich steigern. Dies wird durch die Verteilung von Ressourcen auf mehrere Knoten erreicht, und HA minimiert das Risiko teurer Ausfallzeiten. Dieser Ansatz gewährleistet nicht nur einen kontinuierlichen Betrieb, sondern führt auch zu langfristigen Einsparungen im Vergleich zu den Kosten, die mit einer schlechten Ressourcenverwaltung und Systemausfällen verbunden sind.

Für Unternehmen, die nach Möglichkeiten suchen, ihre IT-Ausgaben zu senken, kann die Implementierung einer HA-Architektur eine Lösung sein, um die Kosten langfristig zu senken. Im Laufe der Zeit machen sich die Vorteile der reduzierten Ausfallzeiten und der optimierten Ressourcen bezahlt. Und Sie profitieren zusätzlich von der erhöhten Zuverlässigkeit.

Warum ist Hochverfügbarkeit wichtig?

Beseitigt einzelne Ausfallpunkte für Komponenten, die bei einem Ausfall den Betrieb stören könnten.
Stellt sicher, dass wichtige Daten regelmäßig gesichert werden und bei Bedarf schnell wiederhergestellt werden können.
Verteilen Sie den Datenverkehr mithilfe des Lastausgleichs gleichmäßig auf Server und Hardware.
Mit der richtigen HA-Lösung können Sie den Zustand und die Leistung von Datenbankservern kontinuierlich im Hintergrund überwachen.
In einigen Fällen kann es Ressourcen über mehrere geografische Standorte verteilen, um vor regionalen Stromausfällen oder Naturkatastrophen zu schützen.
Implementiert robuste Failover-Lösungen für Speichersysteme.

Weitere Ressourcen zur Hochverfügbarkeit, die Sie vielleicht hilfreich finden:

HPE-Lösungen mit StorMagic: Datensicherung und HA am Rande und darüber hinaus

Acronis Cyber Protect Cloud Integration mit StorMagic SvSAN

Hochverfügbarkeit FAQ

Wie wird Hochverfügbarkeit in Virtual Storage eingesetzt?

Eine virtuelle SAN-Lösung kann hochverfügbaren Speicher über zwei oder mehr Knoten schaffen. Durch die aktiv-synchrone Spiegelung zwischen zwei Servern stellt diese Einrichtung sicher, dass auf jedem Server immer eine exakte Kopie der Daten vorhanden ist. Wenn ein Server wegen Wartungsarbeiten oder eines Ausfalls offline geht, funktioniert der verbleibende Server weiter, so dass einzelne Fehlerquellen eliminiert und Ausfallzeiten oder Serviceunterbrechungen vermieden werden.

Ein virtuelles SAN kann hochverfügbaren gemeinsamen Speicher mit nur zwei Servern und einem leichtgewichtigen Zeugen bereitstellen. Der Zeuge, der sich lokal oder remote befinden kann, bietet Quorum für Hunderte von Clustern und kann auf minimaler Hardware, wie z.B. einem Raspberry Pi, laufen.

Wie wird Hochverfügbarkeit in einer hyperkonvergenten Infrastruktur genutzt?

Eine hyperkonvergente Infrastrukturlösung ist für eine einfache Skalierung ausgelegt. Benutzer können einfach einen neuen Knoten und ein leichtgewichtiges Remote Witness hinzufügen, um Hochverfügbarkeit zu erreichen, und dies erfordert nur ein Minimum von zwei Knoten. Der gemeinsam genutzte Speicher funktioniert durch aktiv-synchrone Spiegelung zwischen den beiden Servern. Wenn ein Server ausfällt oder offline genommen wird, arbeitet der verbleibende Server weiter, so dass keine Unterbrechung des Dienstes und keine Ausfallzeiten entstehen.

Wie wird Hochverfügbarkeit im Encryption Key Management genutzt?

Eine Encryption Key Management Lösung bietet flexible Optionen für hohe Verfügbarkeit und stellt sicher, dass Kundenanwendungen durch eine robuste, hochverfügbare Architektur ununterbrochenen Zugriff auf ihre Encryption-Keys haben.

Diese Lösung unterstützt sowohl eine aktiv-passive HA-Konfiguration mit zwei Knoten als auch eine aktiv-aktive 2-Knoten+1-Clustering-Konfiguration und bietet eine abgestufte Redundanz, die so skaliert, dass ein Verlust des Zugriffs auf Encryption-Keys verhindert wird.

Durch die Verwendung von Shards zur Partitionierung und Replizierung von Daten, die Verteilung dieser Shards auf mehrere Standorte und die Clusterbildung, um die Daten einzuschließen, gewährleistet dieses Setup eine Ausfallsicherung, wenn ein Knoten vom Netzwerk getrennt wird. Dadurch wird das Risiko von Serviceunterbrechungen, die den Kunden den Zugriff auf ihre Encryption-Keys verwehren könnten, erheblich reduziert.

Was ist ein Hochverfügbarkeits-SLA?

Hochverfügbarkeit in einem Service Level Agreement (SLA) ist ein Prozentsatz der Betriebszeit, der von einem Serviceanbieter vereinbart wurde. Das ist das, was von ihm erwartet wird, um seinen Kunden zu helfen. Obwohl Hochverfügbarkeitsmetriken manchmal subjektiv sein können, sollten sie im Rahmen von SLAs definiert werden. Einige IT-Teams entscheiden sich vielleicht dafür, andere Verfügbarkeitskennzahlen zu messen, wie z.B.:

Mittlere Zeit zwischen Ausfällen (MTBF)
Mittlere Ausfallzeit (MDT)
Wiederherstellungszeitziele (RTO)
Wiederherstellungspunkt-Ziele (RPO)

Was ist Hochverfügbarkeit? Ein Leitfaden für Einsteiger

Was ist Hochverfügbarkeit?

Wie wird die Hochverfügbarkeit gemessen?