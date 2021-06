Hochverfügbare IT-Systeme benötigen eine Infrastruktur, die durchgängig redundant ist. Dies ist auf allen Ebenen nötig und betrifft sowohl Server und Speichersysteme als auch die für die Kommunikation erforderlichen LAN-, WAN- und Security-Komponenten. Gleiches sollte man für kritische Cloud-Systeme beachten, die sich zum Beispiel durch Maßnahmen wie Standby-Instanzen in einer anderen Region absichern lassen.

Wie hart ein Katastrophenfall Unternehmen treffen kann, hat der Großbrand in den Rechenzentren (RZ) des französischen Cloud-Anbieters OVH im März 2021 in Straßburg gezeigt. Dabei wurde eines von vier RZs komplett zerstört, ein zweites teilweise. Dem Brand fielen mehr als 10.000 Server zum Opfer. OVH informierte die betroffenen Unternehmen und empfahl ihnen, ihre Notfallpläne zu aktivieren.

Alle Unternehmen, die nicht über redundante Server an einem anderen Standort verfügten oder die zumindest ihre Unternehmensdaten mit einer Backup- oder Replikationslösung in ein anderes RZ gesichert hatten, waren durch diesen Brand massiv geschädigt. Zum einen waren die betroffenen Anwendungen für mehrere Tage oder sogar Wochen nicht mehr verfügbar. Zum anderen gingen die auf den zerstörten Systemen gespeicherten Daten unwiederbringlich verloren. Für den Schutz vor derartigen Ausfällen gibt es ein breites Angebot an Hochverfügbarkeitstechniken. Verschiedene Ebenen sind zu berücksichtigen, um auch beim Ausfall eines kompletten RZs im Idealfall nahtlos oder mit einer möglichst kurzen Unterbrechung weiterarbeiten zu können.

Redundanz auf allen Ebenen erforderlich

Um eine möglichst hohe Verfügbarkeit der IT-Infrastruktur zu erreichen, empfiehlt es sich, sowohl innerhalb der jeweiligen Geräte redundante Komponenten einzusetzen, als auch von jeder Gerätekategorie mindestens zwei Systeme zu betreiben. Je nach Hersteller und Produktkategorie unterstützen die Lösungen einen Active-Active- und/oder einen Active-Passive-Betrieb. Die bestmöglich Performance bieten Ac-

tive-Active-Lösungen, weil sie alle vorhandenen Ressourcen nutzen. Bei Active-Passive-Lösungen dagegen läuft ein System im Standby-Modus und tritt erst dann in Aktion, wenn das primäre Gerät ausfällt. Eine vollautomatisierte HA-Lösung (High-Availability) ist zudem in der Lage, die ursprüngliche Konfiguration per Failback-Prozedur wiederherzustellen, sobald die ausgefallenen Systeme wieder verfügbar sind. In HA-Umgebungen sollten alle Hardwarekomponenten wie Server, Switches und Speichersysteme mit redundanten Netzteilen bestückt sein. Es empfiehlt sich zudem, jedes Netzteil an einen eigenen Stromkreis anzuschließen, um auch auf dieser Ebene eine Redundanz herzustellen. Die Netzwerkkarten für die LAN- und SAN-Anbindung sollten ebenfalls mindestens doppelt vorhanden und über zwei oder mehr Switches an das jeweilige Netz angebunden sein. Auch die WAN-Zugänge müssen redundant ausgelegt sein. In Speichersystemen ist der RAID-Controller, der vor Datenverlusten bei einem Festplattenausfall schützt, ein klassischer Single Point of Failure. HA-Storage-Arrays verfügen deshalb über mindestens zwei Controller. Bei SDS-Lösungen (Software-Defined Storage) löst ein in Software implementiertes Erasure Coding die RAID-Controller ab. Die Redundanz ist dadurch gewährleistet, dass zwei oder mehr Storage-Server einen Cluster-Verbund bilden (siehe unten).



© Bild: Cisco Hochverfügbare IT-Systeme benötigen eine durchgängig redundant ausgelegte RZ-Infrastruktur.

Zum Schutz vor Katastrophen wie einem Brand sollten die redundanten Systeme immer auf zwei Standorte oder zumindest zwei Brandabschnitte innerhalb eines RZs verteilt sein. In hochwassergefährdeten Gebieten ist ein zweiter Standort in einer anderen Region dringend zu empfehlen. Unternehmen mit sehr hohen Anforderungen an die Ausfallsicherheit, die auch während der Durchführung von Wartungsarbeiten oder beim Ausfall eines kompletten Standorts auf die HA-Redundanz nicht verzichten wollen, können ihre kritischen IT-Systeme auch auf drei oder mehr Standorte verteilen.

