Unternehmen arbeiten mit riesigen Mengen an heißen Daten. Gleichzeitig gibt es immer mehr warme und weniger kalte Daten. Mit einer Kombination aus Flash und Cloud lassen sich die neuen Anforderungen an Datensicherung und -wiederherstellung meistern. Flash-to-Flash-to-Cloud (F2F2C) hat das Potenzial, den bisherigen Backup-Ansatz Disk-to-Disk-to-Tape (D2D2T) abzulösen.

Das Wachstum des Datenvolumens ist eine bekannte Herausforderung für Unternehmen, aber nicht die einzige. Unternehmen mit intensiver Datennutzung müssen zwischen „heißen“, „warmen“ und „kalten“ Daten unterscheiden. Heiße Daten müssen sofort verfügbar sein, da man sie ständig nutzt, um geschäftskritische Entscheidungen in Echtzeit zu treffen. Warme Daten benötigt ein Unternehmen nicht regelmäßig, es sollte sie aber für den Fall der Fälle leicht verfügbar halten. Auf kalte Daten ist ein Unternehmen nur sporadisch angewiesen. Deswegen sollte es diese so kosteneffizient wie möglich aufbewahren.

Da heiße Daten jederzeit verfügbar sein müssen, werden sie in der Regel in einem schnell zugänglichen Speicher vorgehalten. In hybriden Speicherumgebungen ist dies in der Regel Flash-Speicher. Warme Daten und kalte Daten hingegen sind die Daten, auf die weniger häufig beziehungsweise sehr selten zugegriffen wird. Daher ergibt es Sinn, diese auf langsameren und kostengünstigeren Speicherelementen abzulegen – vor Ort oder in der Cloud.

Heiße Daten kühlen immer schneller ab

Die größte Herausforderung besteht darin, dass heiße Daten schneller als je zuvor zu kalten Daten altern. Das heißt, dass Daten, die man heute als heiß einstuft und auf die man permanent zugreift, morgen schon warm sind und kurz darauf als kalte Daten in einem staubigen Datenarchiv landen. Auf viele dieser Daten greift seit Monaten oder sogar Jahren niemand mehr zu, dennoch muss der IT-Verantwortliche sie noch verwalten, was hohe Kosten verursacht.

Auch die Speicherung großer Datenmengen auf dem Primärspeicher ist aufwendig. Unternehmen wissen, dass ein großer Teil der Daten warm und kalt ist, aber es fehlen ihnen die Werkzeuge, um regelmäßig den Primärspeicher zu bereinigen und Daten auf einen kostengünstigeren Speicher oder in die Cloud zu verschieben. Darüber hinaus wollen die Fachabteilungen über ihre üblichen Anwendungen auf ihre Daten zugreifen und nicht über separate Zugriffspfade nach alten Daten suchen müssen.

Backup als Herausforderung

Eine weitere Herausforderung ist das Thema Backup. Da Daten strategisch immer wichtiger werden, müssen sie auch ihrer geschäftskritischen Rolle entsprechend gesichert und wiederherzustellen sein. Recovery Time Objectives (RTOs), also Wiederherstellungszeitziele, die bisher nur auf kritische Workloads beschränkt waren, haben sich mittlerweile zum neuen Standard für die meisten Produktions-Workloads entwickelt. Viele Unternehmen können diese strengeren Backup- und Recovery-Anforderungen jedoch nicht erfüllen, selbst wenn sie die Daten erfolgreich gesichert haben.

Die herkömmliche Backup-Architektur, die in vielen Unternehmen noch zum Einsatz kommt, basiert auf Festplatten und Bandspeicher. Bei dieser Backup-Strategie, bezeichnet als Disk-to-Disk-to-Tape, speichert man eine Kopie der Daten zunächst auf einer plattenbasierten Backup-Appliance und anschließend auf Band. Die Festplattenkopie bietet eine bessere Wiederherstellungsleistung als Band allein. Da Festplatten teurer sind als Bandspeicher, nutzen Backup-Appliances die Deduplizierung, um eine relativ kostengünstige plattenbasierte Backup-Lösung bereitzustellen. Selbst deduplizierte Festplatten sind immer noch nicht so günstig wie Band, aber die Kostendifferenz ist durch besseres Management mehr als gerechtfertigt. Der D2D2T-Ansatz ermöglicht eine schnellere Datenwiederherstellung von der Backup-Appliance und nutzt Bandspeicher somit für langfristige Aufbewahrung.

Datenwachstum führt zu Problemen bei der Datensicherung

D2D2T löste einige der Management-Probleme bei der Handhabung von Bändern. So müssen Backup-Administratoren nicht mehr nach Bändern suchen, um eine Wiederherstellung durchzuführen, oder sich Gedanken machen, ob ein Satz Bänder vollständig ist. Da Backup-Appliances Festplatten zum Speichern von Backups verwenden, verbessern sie auch die Wiederherstellungszeiten. Dadurch ist es möglich, Datensätze in TByte-Größe in Stunden wiederherzustellen.

D2D2T hat das Backup im Vergleich zu früheren Methoden stark modernisiert. Das Datenwachstum hat zudem verdeutlicht, dass sich Backup-Appliances nicht gut skalieren lassen. Wenn die Kapazität einer Appliance erschöpft ist, muss das Unternehmen immer wieder eine weitere anschaffen. Jede weitere hinzugefügte Appliance ist jedoch eine neue Deduplizierungs- und Verwaltungszone, was letztendlich zu Ineffizienzen führt.

Obwohl sie schneller als Bänder sind, sind die meisten Backup-Appliances auch bei der Wiederherstellung von Daten ineffizient. Sie sind so konzipiert, dass sie Backup-Daten so schnell wie möglich aufnehmen können, während die Wiederherstellungsleistung zweitrangig ist. Für eine schnellstmögliche Wiederherstellung sollten sie die Daten jedoch so schnell bereitstellen, wie der Primärspeicher sie aufnehmen kann. Wenn sich die Festplatten der Appliance füllen, kann die Wiederherstellungsgeschwindigkeit noch niedriger werden. Dies erschwert es zusätzlich, ein System effizient zu betreiben.

Vorteile von Flash bei Backup und Wiederherstellung

Flash-Speicher bietet deutliche Leistungssteigerungen gegenüber Festplatten. Die Speichertechnik erlaubt es, dass die Wiederherstellung von Produktionssystemen so schnell erfolgen kann, wie die All-Flash-Produktionssysteme die Daten aufnehmen. Flash-Backups lassen sich zudem verwenden, um mehr gleichzeitige Server-Backups auszuführen, zugunsten einer besseren Auslastung. Durch die Koppelung von Flash und Datenreduktion lassen sich außerdem eine hohe Wirtschaftlichkeit und Wiederherstellungsleistung erzielen.

Aber es gibt noch einen weiteren Teil des Backup-Problems. Selbst wenn ein Unternehmen Flash-Speicher verwendet, um Rapid-Restore-Funktionen bereitzustellen, muss es weiterhin große Mengen kalter und warmer Daten außerhalb der eigenen Umgebung speichern, um Archivierungs- und Compliance-Richtlinien einzuhalten. Hierfür kommt vielerorts weiterhin das Tape zum Einsatz, was nicht nur komplex und langsam ist: Der eigentliche Nachteil der Bandspeicherung ist, dass die Daten irgendwo offline weggesperrt sind – und somit keinen Wert für das Unternehmen generieren können.

Eine Option ist es, Bandspeicher endgültig durch kostengünstigen Cloud-Objektspeicher, etwa Amazon S3, zu ersetzen. Die neue Backup-Strategie Flash-to-Flash-to-Cloud (F2F2C) wurde für bessere Skalierung und die Umsetzung moderner Backup-Anforderungen konzipiert. Sie bietet flexiblere Backup- und Wiederherstellungsoptionen sowie schnellere Wiederherstellungen zur Erfüllung anspruchsvoller RTOs. Hinzu kommen einfachere und effizientere Abläufe sowie die Kostenvorteile der Cloud.

Lokaler Flash-Speicher für Snapshots und Wiederherstellungen

Diese Architektur nutzt den lokalen Flash-Speicher für effiziente Snapshots und schnelle Wiederherstellungen. Gleichzeitig wird eine kostengünstige, hochbelastbare, externe und selbstgeschützte Public Cloud für die langfristige Aufbewahrung genutzt. Entscheidend ist, dass Wiederherstellungsdaten, sobald sie sich in der Cloud befinden, einen zusätzlichen Geschäftswert liefern, indem man sie für andere Anwendungsfälle wie Test/Entwicklung oder Analysen wiederverwenden kann. Der Backup-Markt befindet sich derzeit an einem Wendepunkt, an dem Flash und die Cloud eine transformative Rolle spielen. Wenn Unternehmen Backup-Daten in die Cloud transferieren, lassen diese sich für Migration, Entwicklung/Test, Analysen etc. wiederverwenden.

Aus dem kalten Archiv in die warme Cloud

Aus kalten Daten im verstaubten Bandarchiv werden somit warme Daten in der Cloud, die jederzeit über eine entsprechende F2F2C-Plattform schnell zugänglich sind.
Bei der Datensicherung geht es nicht mehr nur darum, Daten zu speichern und die Kosten für eine gute Kopie zu minimieren. Es geht um flexible Sicherungen, schnelle Wiederherstellungen und vor allem darum, wertvolle Daten für andere Anwendungen stets verfügbar zu haben, die den Geschäftswert steigern.

In dieser Welt des konstanten Datenflusses wird Disk-to-Disk-to-Tape den Anforderungen nicht mehr gerecht. Flash-to-Flash-to-Cloud hingegen ist für die Datenmengen und -anwendungsfälle von heute konzipiert. Es hilft dabei, mehr aus den Daten herauszuholen, indem man wertvolle Erkenntnisse aus ihnen gewinnt.

Markus Grau ist Principal Systems Engineering bei Pure Storage, www.purestorage.com.