Datenkonvertierung im Detail

Nicht nur für IT-Archäologen

29. Juli 2009, 22:00 Uhr   |  Edmund Hilt/jos Edmund Hilt ist Managing Director bei Kroll Ontrack in Böblingen.

Sorgfältiges Speichern wichtiger Dateien ist notwendig, reicht allein jedoch nicht aus: Entscheidend ist es, auf die benötigten Informationen auch zugreifen zu können. Ein Wirrwarr von Hard- und Softwareformaten macht dies zu einer alles andere als trivialen Aufgabe.

Datensicherheit und Daten-Management sind Hauptzweck einer jeden Speicherlösung. Administratoren stehen jedoch vor immer neuen Herausforderungen. Speicherlandschaften haben auf lange Sicht eine bewegte Geschichte: Bei betagten Storage-Lösungen steigen die Ausfallrisiken, Anbieter von Speichersystemen verschwinden vom Markt, Speicherlösungen werden ausgewechselt. Mit jeder Reorganisation steigt aber das Risiko, auf alte Daten nicht mehr zurückgreifen zu können. Problematisch wird dies, wenn Daten mittel- und langfristig verfügbar sein müssen. Datenkonvertierung spielt daher eine immer entscheidendere Rolle in der Datensicherheit.

Ein aktuelles Beispiel kann diese Problematik erläutern. In der Produktion - unter anderem von Maschinen und Flugzeugen - kamen in den 1980er-Jahren für die Produktionssteuerungen Datenbanken zum Einsatz, die heute zur Technikgeschichte gehören. Die Datenbank und die dazugehörigen Softwareanwendungen steuerten im Zusammenspiel die gesamte Produktion, erstellten technische Zeichnungen, Stücklisten und Dokumentationsmaterial. Auch eine Versionskontrolle war mit solchen Systemen wie zum Beispiel Turbo-Image durchaus möglich. Gespeichert wurde das Ganze dann auf damaligen 9-Zoll-Bändern für den HP3000-Computer mit dem Betriebssystem MPE. Das Überspielen dieser Daten auf aktuelle Medien ist aber auch heute noch möglich. Was damals State of the Art war, ist heute zwar ein Fall für IT-Archäologen und Konvertierungsexperten - der Aufwand lohnt sich jedoch, wenn alte Projekte wieder dokumentiert werden sollen. Dies kann bei einem plötzlichen Gewährleistungsanspruch oder bei der Wiederaufnahme der Produktion schnell der Fall sein.

Neben alten Beständen sind häufig auch aktuelle Datensätze zu integrieren - etwa bei der Einführung neuer Speicherlösungen oder bei der Übernahme von Unternehmen und ihrer Infrastruktur. Zudem spielen rechtliche Anforderungen eine immer größere Rolle. Die Anfrage eines Wirtschaftsprüfers, alle Daten der letzten zehn Jahre zur Verfügung zu stellen, wird schnell zu einer Reise in die Backup-Vergangenheit eines Unternehmens.

Konvertierung ist aber nicht nur eine zeitintensive Aufgabe, sondern bietet auch Folgenutzen: In einem Arbeitsgang lassen sich auch eine Deduplizierung und eine Komprimierung durchführen. Dazu wird die Speicherlandschaft untersucht, außerdem die notwendige Konvertierungsstrategie entwickelt und gleichzeitig umgesetzt. Dies baut das Datenvolumen ab und verringert die Kosten für die Speicherinfrastruktur. So gelangen relevante Geschäftsinformationen in einen mittel- und langfristigen Zugriff.

Konvertierungsschauplätze

Datenkonvertierung hat drei Hauptaufgaben. Erstens sorgt die Medienkonvertierung dafür, die verschiedensten Datenträger wieder bearbeiten zu können. Tapes sind dabei allen Unkenrufen zum Trotz auch heute noch das Hauptmedium für die mittel- und langfristige Datensicherung. Deswegen werden zweitens auch die unterschiedlichsten Backup-Formate unterstützt. Drittens geht es darum, Daten von verschiedenen Anwendungen in andere zu übertragen. Wichtig ist dabei zudem die Herkunft der Daten: Mainframe-Daten müssen eventuell für die Midrange- oder PC-Ebene zugänglich sein. Auch die Konvertierung zwischen Betriebssystemen spielt eine wichtige Rolle.

Wer Daten von den verschiedenen Medien überspielen will, sieht sich allein schon einem ständigen Wechsel der Bauformen verschiedener Bänder und Laufwerke gegenüber. Auch die Technik hat sich verändert, und Hersteller sind vom Markt verschwunden. Bei den Tapes gibt es eine Fülle von Aufzeichnungssystemen, die sich allein in den Bauformen unterscheiden. So ist beispielsweise DLT nicht gleich DLT. Wikipedia verzeichnet etwa zurzeit 20 Varianten mit verschiedenen Bauformen, Spurenaufbau und Datendichte. Zudem sind je nach Variante Daten verschlüsselt oder offen aufgezeichnet. Im Endergebnis sind daher die verschiedenen Varianten nur zum Teil kompatibel.

Datenkonvertierung

Der für eine Konvertierung nötige Werkzeugkasten wird größer, wenn man sich mit der logischen Organisation der Daten auf den Medien auseinandersetzt. Die Zahl der Programme, die für den logischen Aufbau der Datenaufzeichnung alleine bei Tapes zuständig sind, geht in die Hunderte. Standardisierung ist und bleibt an dieser Stelle folglich eine Utopie. Im Mainframe-Bereich gibt es allein schon von IBM verschiedene Formate. Dabei können Daten in Blöcken fixer oder variabler Länge aufgezeichnet werden. Doch dies ist nur ein Ausschnitt der Großrechnerwelt. Das generell offene Unix bringt weitere Variablen ins Spiel. Es kennt mit Tar, cpio und Dump allein schon drei Grundformate. Auf Desktop-Ebene gibt es in den einzelnen Betriebssystemumgebungen unterschiedliche Backup-Formate durch die zahllosen unterschiedlichen Softwarelösungen.

Häufiger müssen aber auch Großrechnerdateien heute auf Server oder PC verfügbar sein. Ein zusätzliches Problem ist dabei die unterschiedliche Kodierung der digitalen Inhalte, die sich bei Mainframe-, Midrange- und Desktop-Systemen unterscheiden. IBM- und AS/400-Rechner kodieren das Alphabet mit dem EBCDIC-Code, während in den allermeisten Fällen der ASCII-Code üblich ist. Folglich wird auch für den Inhalt der Anwendungen Übersetzungsarbeit nötig.

Babylonische Ausmaße nimmt das Problem der der generellen Umwandlung von Anwendungsdaten an. Bereits alte Textdokumente aus der DOS-Ebene sind eventuell nicht mehr einlesbar. Im CAD-Bereich schätzen Experten den Aufwand durch Konvertierung und Reparaturen von Dateien proprietärer Anwendungen pro Einzelprojekt auf rund sechs bis zehn Stunden. Allein Machbarkeitsstudien zur Datenkonvertierung von Flächenwidmungsplänen wurden schon zum Thema für eine umfangreiche Diplomarbeit. Solche Tools müssen eigens entwickelt werden. Ihre Verwirklichung hängt letztlich davon ab, ob der Aufwand der Programmierung sich finanziell rechnet.

Angesichts dieser Gemengelage wird Datenkonvertierung zu einer komplexen Aufgabe, die über das einfache Überspielen und Migrieren von Daten hinausgeht. Konvertierungsprojekte sind umfangreiche, je nach vorliegender IT-Landschaft immer wieder verschiedene Projekte. Sie bestehen in einem ersten Schritt aus einer umfassenden Bestandsaufnahme dazu, welche Systeme überhaupt vorhanden sind und in Einklang gebracht werden müssen. Dies erfordert letztlich die gesamte Nachzeichnung der Backup-Geschichte.

Das Problem steckt dabei nicht selten im Detail. Oft sind zum Beispiel einmalige Entwicklungsdaten oder auch selbst entwickelte Anwendungen auf einem Datenträger gesichert, der nicht in die zentrale Datensicherung eingebunden waren. Nach der Bestandsaufnahme, die klärt, welche Backup-Systeme vorliegen, müssen alle Dateien identifiziert und katalogisiert werden, um zusammenhängende Daten zu organisieren. Wenn einige zu konvertierende Informationen nicht mehr im Zugriff sind, ist auch eine Datenrettung fällig. Logische und physische Beschädigungen - schon das einfache Fehlen eines Ersatzteils bei einem Laufwerk - können dazu führen, dass Daten nicht mehr lesbar sind. Doch selbst von gerissenen Bändern oder auch von Datenträgern, in denen Log-Dateien und Steuerungsdaten verloren gegangen sind, lässt sich vieles wieder herstellen.

Erst im nächsten Schritt erfolgt die eigentliche Konvertierung der Daten. Dabei kommen meistens eigens entwickelte Tools zum Einsatz, die die Umwandlung vornehmen. Die Experten können zum Beispiel VMS-Backups automatisch verarbeiten und in eine PC/Windows-Plattform übertragen und wieder zurück. Für jedes Problem lassen sich so Lösungen entwickeln, die oft innerhalb weniger Stunden mehrere GByte an Daten überspielen können.

Ist erstmal für Ordnung in der Datenlandschaft gesorgt, bieten anschließende Dienstleistungen über die Migration hinaus Mehrwert. Deduplizierung, Duplizierung, Extrahierung oder aber auch Löschungen sind oft überhaupt erst jetzt möglich oder lassen sich einfacher, schneller und zuverlässiger durchführen.

Zukunftssicherung

Datenkonvertierung wird immer wichtiger. Die Halbwertszeit digitaler Daten durch neue Speicherlösungen nimmt eher ab. Schon jetzt raten Experten angesichts des technischen Fortschritts dazu, Unternehmensdaten alle fünf Jahre zu konvertieren. Die Überspielung von Informationen wird daher ein integraler Bestandteil von Datensicherheit. Unternehmen oder auch Behörden, die mittel- und langfristig über ihre Daten verfügen müssen, sehen sich früher oder später mit diesem Problem konfrontiert. Eine Lösung gibt es mit den richtigen Experten in den meisten Fällen. Für jeden Projektfall lässt sich ein Konvertierungsfahrplan erstellen. Doch auch die Administratoren selber können im Vorfeld wichtige Weichen stellen: Durch Backup-Disziplin und übersichtliche, weil gut dokumentierte Speicherlandschaften.

Auf Facebook teilenAuf Twitter teilenAuf Linkedin teilenVia Mail teilen

Das könnte Sie auch interessieren

Verwandte Artikel

Default