Effiziente und sichere Disaster-Recovery-Strategien

Den Ernstfall im Visier

19. Mai 2005, 23:16 Uhr | Marcus Schneider/jos Marcus Schneider ist Director Storage Product Marketing bei Fujitsu Siemens Computers.

Virtuelle Tape Appliances sollen mit vertretbarem Aufwand für funktionierende Disaster-Recovery-Strategien sorgen. Fujitsu Siemens Computers will mit der Centricstore-Lösung gleichermaßen Unix, Windows-, Linux- und Mainframe-Systeme in ein gemeinsames unternehmensweites Speichernetzwerk integrieren.

Die Planung von Notfallszenarien ist für IT-Manager gewissermaßen zur Überlebensnotwendigkeit
geworden. Denn neben schärferen gesetzlichen Anforderungen muss die IT den steigenden Anforderungen
von Kunden, Partnern und Mitarbeitern genügen. Deren einhellige Forderungen laufen auf einen
möglichst kontinuierlichen Geschäftsbetrieb und immer kürzer werdende Wiederanlaufzeiten nach einem
Ausfall hinaus. Es ist jedoch für die meisten IT-Infrastrukturaufgaben wirtschaftlich nicht
sinnvoll, gleich vollständig redundante und höchstverfügbare Server- und Storage-Systeme
einzusetzen. Mithilfe von virtuellen Tape Appliances lassen sich umfassende
Disaster-Recovery-Strategien mit vertretbarem Aufwand umsetzen. Sie sollen eine einfache,
kosteneffiziente und schnelle Datenwiederherstellung bei Ausfällen und Datenverlusten
ermöglichen.

Immer mehr Geschäftsprozesse stellen extrem hohe Anforderungen an die kontinuierliche
Verfügbarkeit von Daten und Infrastrukturen. Bei Web-Application-Servern, Shopsystemen oder
Transaktionssystemen kostet jede Stunde Stillstand viel Geld. Daneben gibt es jedoch eine Vielzahl
von scheinbar unkritischeren Systemen, auf die ein Unternehmen zur Not für einige Stunden
verzichten kann. Irgendwann drohen jedoch auch hier massive Folgen, wenn Daten verloren gehen oder
erst ein Ersatzsystem beschafft werden muss. Die Toleranzgrenzen für den Wiederanlauf werden zudem
immer enger.

Im Bankenumfeld regelt in Deutschland das Gesetz über die "Mindestanforderungen für das
Betreiben von Handelsgeschäften (MaH)" die Bereitstellung eines Minimums an Betriebsbereitschaft.
Unter anderem fordern die MaH ausdrücklich neben einer Planung für Notfälle auch kurzfristig
einsetzbare Ersatzlösungen, falls zum Beispiel die für das Handelsgeschäft erforderlichen Systeme
ausfallen sollten. Auch die sehr engen Puffer bei Just-in-Time-Lieferketten vertragen keine
mehrtägigen Ausfälle. Die Mehrzahl der Business-Critcial-Anwendungen orientiert sich derzeit sogar
bereits an einem Recovery-Fenster von vier Stunden. Deshalb verwundert es nicht, dass nach
branchenübergreifenden Statistiken ein Großteil aller Unternehmen, die ihre IT ohne
Disaster-Recovery-Verfahren aufgebaut haben, im Schnitt innerhalb von fünf Jahren nach einem
Katastrophenfall ihren Geschäftsbetrieb einstellen müssen.

Daten sind nicht gleich Daten. Nicht alle Daten eines Unternehmens müssen gleich verfügbar
gehalten werden. Ein wesentlicher Erfolgsbestandteil einer Disaster-Recovery-Strategie ist daher
die Klassifizierung aller geschäftskritischen Daten. Die Zugriffshäufigkeiten und das Alter von
Daten können hier zwar Hinweise geben, aber auch ein selten benötigter Datenbankindex kann den
Wiederanlauf stark ausbremsen, wenn er erst mühsam neu erzeugt werden muss. Daher ist eine
geschäftsprozessorientierte Sicht unerlässlich, um tatsächlich alle relevanten Daten für den
Wiederanlauf wichtiger Systeme zu erfassen.

Prioritäten setzen

Ein zweites wichtiges Prinzip ist die Reduktion auf das Wesentliche, denn je weniger Daten
restauriert werden müssen, desto schneller ist der Wiederanlauf. In diesem Punkt hilft der Gedanke
des Information-Lifecycle-Managements (ILM) weiter: Liegen tatsächlich nur die aktuell wichtigen
Daten auf den primären Onlinespeichern? Sind alle Möglichkeiten zur Verdrängung auf sekundäre
Onlinespeicher oder auf Band ausgereizt? Durch die Klassifizierung hilft ein ILM also nicht nur
beim Einsparen von Speicherkosten, sondern beschleunigt auch Recovery-Szenarien.

Ökonomische und klare Notfallprozesse sind darüber hinaus zwingend erforderlich. Im Notfall muss
alles schnell gehen, es bleibt keine Zeit für umständliche Verfahren. Voraussetzung dafür ist neben
organisatorischen Maßnahmen eine zuverlässige und im Ernstfall einfach zu beherrschende
Speicherinfrastruktur. In der Realität sind nämlich allzu oft undurchschaubare, fehleranfällige und
schlecht dokumentierte Skriptlösungen gerade in verteilten Umgebungen ein Hindernis für
erfolgreiche Notfallkonzepte.

Typischerweise sind solche Skripts für eine ganz bestimmte Hard- und Software entwickelt worden
und damit beim Wechsel auf eine neue Plattform nicht mehr zu gebrauchen. Die Pflege der Software
ist zeitaufwändig, personalintensiv und damit teuer. Zudem benötigt das korrekte Rückspielen
klassischer Tape-Sets im Ernstfall viel wertvolle Zeit und Aufmerksamkeit beim Personal, eine
Situation, die es grundsätzlich zu vermeiden gilt.

Tape Storage virtualisieren und konsolidieren

Virtuelle-Tape-Storage-Systeme sollen in diesem Punkt Abhilfe schaffen. Sie bieten die
Möglichkeit, Daten aus verschiedenen Systemwelten zusammenzuführen, denn die
Virtualisierungsschicht verhält sich gegenüber den Servern, Filern und Anwendungen wie ein reales
Bandlaufwerk. Ansprechen lassen sich die virtuellen Laufwerke über alle De-facto-Industriestandards
wie Fibre Channel, SCSI oder Escon – auch hier ist keine Umstellung nötig. Als Beispiel in diesem
Zusammenhang kann "Centricstor" von Fujitsu Siemens Computers gelten, eine virtuelle Tape-Lösung,
die laut Hersteller gleichermaßen Unix, Windows-, Linux- und Mainframe-Systeme in einem gemeinsamen
unternehmensweiten Speichernetzwerk mit einer effizienten und bezahlbaren virtuellen
Bandspeicherlösung konsolidieren kann.

Das Prinzip dahinter ist einfach: Statt Tape Drives oder Tape Libraries direkt mit den Servern
oder Speichernetzen zu verbinden, verwaltet sie die virtuelle Tape Appliance zentral. Den Servern
und Anwendungen stehen auf diese Weise stets virtuelle Bandlaufwerke zur Verfügung, wenn ein
Geschäftsprozess dies erfordert. Die Zeiten für Backup und Restore reduziert der integrierte
schnelle Disk Cache auf ein Minimum.

Die Virtualisierungsschicht sorgt zudem für eine gleichbleibend hohe Quality of Service (QoS),
unabhängig von der gerade eingesetzten Tape-Hardware oder Backup-Software. Nach einem Ausfall
lassen sich die Daten durch den konsistenten Disk Cache sehr viel schneller als bei konventionellen
Disk-to-Tape-Backup-Lösungen wieder herstellen. Zudem können sehr fortschrittliche virtuelle Tape
Appliances die Datenspiegelung an einen zweiten Standort sogar selbsttätig und vollkommen
transparent für den Anwender durchführen.

Service-Level für Disaster Recovery

Die Eigenintelligenz der virtuellen Tape Appliance sorgt dafür, die Daten differenziert nach
Herkunfts- und Ablageort zu verwalten. Speziell auf der Ebene des Disk Caches sind verschiedene
Service Level Agreements für jede virtuelle Volume Group einstellbar. Eine virtuelle Volume Group
ist das Pendant zur physikalischen Variante, übertragen auf die virtuellen Magnetbandlaufwerke.
Schnelle Zugriffszeiten beim Recovery garantiert beispielsweise die Disk Cache-Residency, also die
Strategie zum Vorhalten der Daten einer Volume Group im schnellen Plattenspeicher.

Die Attribute der Service-Level reichen von der Verfügbarkeit über die Restore-Geschwindigkeit
bis hin zu so komplexen Anforderungen wie Echtzeitkatastrophenschutz und totalen Diebstahlschutz.
Ein weiterer Aspekt ist ebenfalls wichtig: Durch die Zuweisung unterschiedlicher Service-Level
lassen sich Daten unterschiedlicher Kunden klar abgrenzen oder die Anforderungen verschiedener
Abteilungen differenzieren.

Für echte Notfallkonzepte sind beispielsweise in der Regel mindestens zwei Kopien der Daten
gefordert. Mit der Centricstor-Funktion mit der Bezeichnung "Dual Save" lassen sich von einem
logischen Volume zwei räumlich getrennte Kassetten (physikalisches Volume) gewissermaßen in
Echtzeit abspeichern. Ein zu duplizierendes Volume wird dazu direkt aus dem Disk Cache auf zwei
physikalische Volumes geschrieben. Falls der Originaldatenträger fehlerhaft oder zerstört ist,
lässt sich auf die Kopie ohne weiteres manuelles Zutun zugreifen.

Das automatische Media-Refreshing in Verbindung mit der automatisierten Reorganisation sorgt
zudem für fehlerfreie Sicherungsdaten und die wirtschaftliche Nutzung der vorhandenen Kapazitäten.
Auch die automatische Erstellung und Auslagerung von Bandkopien ist möglich, und zwar durch die
Funktion "Remote Dual Save". Durch die ständige Verbindung von zwei getrennt aufgestellten
virtuellen Tape Appliances soll so bei Ausfall eines Systems der unterbrechungsfreie Betrieb
vollständig sichergestellt sein.

Bei der aktuellen Version Centricstor 3.1 ist zudem ein automatisches Failover und
Cache-Mirroring in Echtzeit enthalten. Es sorgt bei Katastrophen für Hochverfügbarkeit und einen
umfassenden Schutz vor Datenverlust für alle Nearline-Daten. Auf dem internen Festplattensystem
zwischengespeicherte Daten werden dazu an einen zweiten Cluster-Standort synchron gespiegelt. Dies
erfolgt über 2-GBit-Fibre-Channel-Verbindungen – mit FC-IP-Brücken bei Bedarf auch über sehr große
Distanzen. Durch die Echtzeitspiegelung arbeiten zwei getrennt aufgestellte Teile des Systems mit
völlig identischem Datenstand. Selbst bei vollkommener Zerstörung eines Standorts soll somit ein
größtmöglicher Datenschutz und gleichbleibende Servicequalität gewährleistet sein.

Alternativen

Die "Rund-um-die-Uhr"-Verfügbarkeit von Kernanwendungen wie DBMS-Systemen erlaubt keine
konventionellen Client-/Server-Sicherungsverfahren mehr. Neue Techniken wie Serverless
Backup/Restore (Stichwort: Network Data Management Protocol – NDMP) oder
Point-in-Time-Copy-Verfahren mit Snapshots bieten zwar eine Entlastung von Applikationsservern und
Netzwerken. Durch unterschiedliche Softwarestandards und Geräteschnittstellen in der
Client-/Server-Welt sind jedoch zum Teil erhebliche Integrationsaufwendungen zu leisten. Ist dies
die einzige Disaster-Recovery-Strategie im Unternehmen, besteht die Gefahr von komplexen und
schwierig zu administrierenden Prozeduren und vielfältigen Konfigurationsmöglichkeiten.

Ein weiteres Problem sind die immer kürzeren Backup-Zeitfenster – schließlich wollen sehr viele
IT-Betreiber ihre Daten letztlich immer auf dem extrem kosteneffizienten Magnetband lagern. Da
immer mehr Anwendungen im Unternehmen rund um die Uhr zu unterstützen sind, stehen dem klassischen
Backup die physikalische Grenzen im Weg. Beispielsweise kann 1 TByte an Information zirka 30
Stunden Sicherungszeit erfordern. Dies ist schlicht zu lange für viele Sicherungsfenster. Die
Ausweichstrategien über schnellere Techniken oder zusätzliche Tape Drives erreichen schnell die
Wirtschaftlichkeitsgrenze. Zudem ist mit Leistungseinschränkungen bei den Applikationsservern zu
rechnen, die sich bei zu hohen Belastungen möglicherweise für den Anwender negativ bemerkbar
machen.

Die zusätzlichen Verfahren sind jedoch keineswegs unsinnig. Vielmehr muss jeder
IT-Verantwortliche abwägen, wie er das geforderte Optimum aus Leistung und Kosteneffizienz
erreicht. Sollen die Daten grundsätzlich irgendwann jedoch auf Tape-Speichern landen, so dürfte der
Weg über die Konsolidierung in einer virtuellen Tape Appliance sich als sehr wirtschaftlich
erweisen.

Disaster Recovery als eine individuelle Aufgabe

Welche Informationen in einem Unternehmen schützenswert sind, können nur die
Prozessverantwortlichen beurteilen. Hier gilt es stets Kosten, Folgen und Risiken abzuwägen, um
eine wirtschaftlich sinnvolle Priorisierung zu finden. Aber eines ist sicher: Die Planung für
Notfallszenarien ist heute für die IT zur Überlebensnotwendigkeit geworden. Zu verzahnt und
voneinander abhängig sind Informationstechniken und Geschäftsprozesse geworden.

Zudem ändern sich die Notwendigkeiten schnell. Wer sich an neue Sicherheitsbedürfnisse oder
Optimierungswünsche schneller anpassen kann, ist im Vorteil. Virtuelle Tape Appliances mit einer
großen Bandbreite an frei definierbaren Service-Level geben den IT-Verantwortlichen den nötigen
Spielraum, um ein individuelles und kostenoptimiertes Disaster-Recovery-Konzept zu erstellen. Als
Fazit steht in jedem Fall fest: Das Information-Management und die kontinuierliche Bereitstellung
relevanter Geschäftsdaten über Backup und Recovery und Business Continuity sind damit längst zum
klaren Differenzierungsfaktor für moderne IT-Dienstleister geworden.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+