Backup in Vmware-Umgebungen

Die Varianten der Deduplikation

16. Juli 2008, 22:57 Uhr | Andreas Mayer/dp Andreas Mayer ist Leiter Business Development beim Storage-Dienstleister Orchestra Service SE in Gilching.

Vmware-Umgebungen sind mittlerweile weit verbreitet, und die Branche verzeichnet noch immer hohe Wachstumsraten. Allerdings berücksichtigen die Betreiber häufig nicht, wie sich diese virtuellen Systeme optimal in ein Backup- und Recovery-Konzept integrieren lassen.

Gerade durch die Vielzahl von virtuellen Servern entstehen besondere Anforderungen an die
Backup-Lösung. Die großen Backup-Datenvolumen in den virtuellen Umgebungen müssen entsprechend
gesichert und verwaltet werden. Ziel ist es, beim Vmware-Backup die Auswirkungen dieser Backups auf
physische Maschinen zu reduzieren und eine Duplikatbereinigung innerhalb von virtuellen Maschinen
sowie über virtuelle Maschinen hinweg zu erhalten. Des Weiteren müssen auch Datenbanken in
virtuellen Umgebungen zuverlässig und konsistent gesichert werden. Unternehmen setzen
Vmware-Umgebungen sehr unterschiedlich ein, sodass zunächst der jeweils optimale Backup-Ansatz
ermittelt werden muss, der den dort vorherrschenden Anforderungen gerecht wird.

Dabei sollte eine Backup-Lösung für virtualisierte Umgebungen auf jeden Fall eine Deduplikation
enthalten, da viele Daten häufig redundant gehalten werden und die Deduplikationseffekte somit
erheblich sind. Denn solche Lösungen teilen den Datenstrom in Segmente auf und suchen nach
Redundanzen. Bereits bestehende Segmente schreibt das System nicht mehr neu, sondern legt nur noch
einen Verweis auf das erste ab. So entstehen über die entsprechende Backup-Retention beachtliche
Einsparungen an physischer Plattenkapazität.

Es existieren inzwischen zahlreiche Deduplikationslösungen, die sich technisch unterscheiden. So
führen manche Systeme die Deduplikation "on the Fly" beim Schreiben aus. Andere schreiben die Daten
im "PostProcessing"-Verfahren erst auf Platte, und die Deduplikation (Dedup) erfolgt später. Diese
Variante benötigt mehr Plattenplatz im System, kann aber unter Umständen die Daten etwas schneller
wegschreiben. Doch dieser Effekt macht sich kaum bemerkbar, wenn das System mit dem
On-the-Fly-Verfahren über eine hohe Prozessorleistung und schnelle Dedup-Algorithmen verfügt. Dann
erfolgt auch hier die Deduplizierung in vergleichbarer Geschwindigkeit, und der Anwender benötigt
deutlich weniger Plattenkapazität. Dies wirkt sich wiederum positiv auf die Stromkosten aus. Ein
Anbieter solcher On-the-Fly-Lösungen ist zum Beispiel Data Domain. Dieser arbeitet mit einem
Inline-Dedup-Verfahren, während Lösungen wie EMC Avamar oder Symantec Netbackup Pure Disk mit
verteilten Client-Agenten arbeiten. Beide haben einen ähnlichen Ansatz und führen die Deduplikation
auf verteilten Geräten, etwa in Außenstellen durch, sodass sie nur neue Backup-Daten übertragen und
so für eine geringe Belastung der LAN- und WAN-Verbindungen sorgen. Darüber hinaus findet eine
zentrale Deduplikation mit den Serverkomponenten der Lösungen statt.

Netapp arbeitet ebenfalls mit Deduplikation und hat das Post-Processing-Verfahren in das
Betriebssystem seiner Fabric-Attached-Storage-Systeme (FAS) implementiert. So lässt es sich für
Primär-, Backup- und Archivdaten nutzen.

Besonders flexibel ist eine EMC Disk Library mit Datendeduplikation (DL3D), denn das System
arbeitet inline und kann bei der Deduplizierung wahlweise on the Fly oder im
Post-Processing-Verfahren eingesetzt werden. Welches Verfahren besser geeignet ist, hängt davon ab,
wie die Daten- und die Infrastruktur aufgebaut sind.

Aufgrund der zum Teil sehr unterschiedlichen Techniken stellt dieser Beitrag exemplarisch drei
marktbedeutende Lösungen im Zusammenspiel mit der Vmware-Umgebung vor.

EMC Avamar und Networker

Die Deduplizierung mit EMC-Avamar-Clients unter Einbeziehung des Vmware Consolidated Backup
(VCB) und der EMC-Backup-Software Networker ist das erste Einsatzszenario. Dabei verfügen die
Networker-Clients über integrierte Avamar-Funktionen zur Datendeduplizierung und zum Backup von
Dateisystemen. Die Lösung verwaltet der Administrator zentral. Die Deduplikation erfolgt an den
verteilten Clients sowie auf dem Avamar-Server. Das Avamar-System besteht aus einer
RAIN-Architektur (Redundant Array of Independent Nodes), das Serverknoten-Failover, Fehlertoleranz
und Onlineskalierbarkeit bietet. Das System kann physisch aus bis zu 16 Nodes bestehen, davon 14
Storage Nodes, ein Utility Node für die Kommunikation und ein Spare Node. Jeder Storage Node hat
eine Kapazität von 2 TByte.

Das System wird täglich zwei Integritätsprüfungen unterzogen. Avamar in der Kombination mit VCB
ermöglicht das Backup von vielen virtuellen Maschinen, deren virtuelle Disks (VMFS) zum Beispiel
auf RAID-Systemen mit ISCSI- oder SAN-Anbindung liegen. VCB übernimmt die Kontrolle und Konsistenz
der VMs (Virtual Machines) auf dem ESX-Server. Somit entsteht keine zusätzliche Last auf dem
ESX-Server. Der Backup-Datenstrom geht allein über den VCB Proxy Server. Die Steuerung der Backups
übernimmt der Networker Server, der zudem die zentrale Deduplizierung mit Avamar-Technik
vornimmt.

Diese Lösung ist vor allem dann interessant, wenn ein Unternehmen seine Außenstellen bereits mit
Avamar sichert und nun auch die Vmware-Landschaft in das Konzept einbinden möchte. Vorteilhaft ist
diese Lösung auch dann, wenn schmale Netzbandbreiten und ein überwiegendes File-Backup vorliegen.
Sie eignet sich nicht so gut für Vmware-Umgebungen mit großen Datenbanken und hohen Service Level
Agreements für ein schnelles Recovery.

Amavar Virtual Edition

Die Backup-Lösung EMC Avamar Virtual Edition für Vmware ist selbst eine virtuelle Lösung und
stellt die Avamar-Serversoftware in der VM bereit. Dies ist der branchenweit erste virtuelle Server
zur Deduplizierung für Backup und Disaster Recovery. Die Lösung nutzt eine gemeinsame Server- und
Speicherinfrastruktur und ist nicht an die sonst übliche Avamar-Hardwaretopologie gebunden, da
diese virtuell abgebildet wird. Zudem eignet sie sich für SAN, NAS und DAS.

Die Replikation von Anwendungen und Speicher macht den Transport von Bändern überflüssig. Es ist
auch die Replikation zwischen virtuellen Avamar-Maschinen oder von virtuellen Avamar-Maschinen zu
Avamar Data Store oder Standard-Avamar-Servern möglich. Insbesondere bei diesem Ansatz sollte der
Administrator aber darauf achten, dass er sauber aufgesetzt ist, damit Produktiv- und Backup-Daten
nicht auf einem physischen System vermischt werden, da dies die Sicherheit der Backup-Daten
gefährden könnte.

Data Domain und Networker

Die Deduplikation mit einer Data-Domain-Lösung, kombiniert mit Vmware VCB und einer klassischen
Backup-Software wie zum Beispiel Networker ist die schnellste der drei Varianten. Sie eignet sich
für das Backup von vielen virtuellen Maschinen, deren virtuelle Disks (VMFS) zum Beispiel auf einem
RAID-System mit FC-SAN- oder ISCSI-Anbindung liegen. Der VCB übernimmt hier die Kontrolle und die
Konsistenz der VMs auf dem ESX-Server. Auch hier entsteht keine Last auf dem ESX-Server, weil der
Backup-Datenstrom nur über den VCB Proxy Server geht. Die Steuerung des Backups übernimmt eine
Backup-Software wie Networker, Netbackup oder auch Commvault. Die Data-Domain-Hardware dedupliziert
und speichert das Backup großer VM-Image-Dateien auf Festplatten ab.

Diese Lösung lässt sich einfach in eine bestehende Backup-Umgebung integrieren und benötigt bei
der Backup-Software nur ein Backup-to-Disk-Modul. Zudem bringt diese Variante eine Einsparung von
Strom und damit auch Stromkosten über einen Zeitraum von drei Jahren von über 75 Prozent bei einer
benötigten logischen Kapazität von 100 TByte im Vergleich zu einem konventionellen Disk-System.

Diese Lösung ist ideal bei Umgebungen mit hohen Anforderungen im Bereich SLAs, wo meist ein
schnelles Disaster Recovery benötigt wird. Auch bei kritischen und großen Datenbanken ist diese
Variante zu empfehlen, da hier ebenfalls eine hohe Recovery-Performance notwendig ist. Idealerweise
sollte ein Unternehmen die Datenbanken aber direkt über das entsprechende Onlineapplikationsmodul
der Backup-Software sichern, damit die Konsistenz der Datenbank gewährleistet ist. Denn VCB Proxy
garantiert dies nicht.

Fazit

Allein diese drei Lösungsvarianten zeigen, dass bei der Entscheidung für die richtige
Backup-Strategie in Vmware-Umgebungen der Verantwortliche zunächst die konkreten Anforderungen
ermitteln muss, ob und in welcher Größenordnung zum Beispiel Datenbanken integriert werden müssen,
wie viele VMs gesichert werden müssen oder wie hoch die Anforderungen an das Recovery sind. Diese
Abschätzung ist maßgeblich für die Entscheidung, welche Backup-Lösung sich dafür am besten
eignet.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+