Vielseitige Datenbankarchivierung

Mehr als Compliance-Erfüllung

26. September 2012, 6:00 Uhr | Kilian Götz/pf, Produkt-Manager Datenbankarchivierung für die Standardsoftware Chronos bei CSP.

Beim Stichwort Datenbankarchivierung denken viele Betroffene nur an die Datenbankentlastung, andere hingegen an gesetzliche Anforderungen. Beide Betrachtungen greifen zu kurz. Tatsächlich lassen sich mit Standardsoftware recht vielfältige Aufgabenstellungen rund um die Datenbank und die Aufbewahrung von Daten lösen.

In den letzten Jahren rückte die Datenbankarchivierung verstärkt auf die Agenda von Administratoren. Grund dafür ist das enorme Datenwachstum. Wie die IDC-Studie „Extracting value from Chaos“ belegt, stieg das Datenvolumen in den zurückliegenden fünf Jahren um den Faktor 5 an, und 90 Prozent des derzeitigen globalen Datenbestands sind sogar erst in den letzten zwei Jahren entstanden. Daher spüren Unternehmen oft sehr schnell, wie ihre produktiven Datenbanken immer langsamer werden. Da sie in der Regel nur immer neue, performantere Hardware zur kurzfristigen Abhilfe beschaffen, entsteht schnell ein Teufelskreis aus Speicherproblemen, Kostenanstieg und Performance-Einschränkungen im Livebetrieb. Alternativ dazu können Unternehmen aber auch Daten aus den relationalen Datenbanken auslagern. Der überwiegende Teil der Informationen in Datenbanken ist aufgrund gesetzlicher Vorgaben ohnehin aufbewahrungspflichtig. Daher empfiehlt sich hier schon aus Compliance-Gesichtspunkten eine professionelle Datenbankarchivierung. Nur so kann der Anwender die Verfügbarkeit und Lesbarkeit der langfristig zu archivierenden Daten sicherstellen. In vielen Fällen sind die archivierten Datenbanken jedoch keineswegs revisionssicher und entsprechen somit nicht den gesetzlichen Anforderungen. Bei zu einfach konzipierten Lösungen bemerken die Administratoren dies im Zweifel jedoch erst zu spät – nämlich, wenn sich ältere Daten nicht wie erwartet in die aktuelle Datenbank zurückspielen lassen.

Drei Varianten der Datenbankarchivierung

Grundsätzlich sind in den Unternehmen derzeit drei verschiedenen Möglichkeiten der Datenbankarchivierung verbreitet: Backup- und Export-Files, Eigenentwicklungen sowie applikationsunabhängige Standardlösungen. Bei der ersten Variante, der Archivierung von Backup- und Export-Files, werden Backup-Dateien zu regelmäßigen, definierten Zeitpunkten in ein Langzeitspeichersystem geschrieben. Dies ist ein einfach zu realisierender, manueller Vorgang. Problematisch sind neben einem hohen personellen Aufwand die Fehleranfälligkeit sowie die Größe der resultierenden Datei, die einen Komplettabzug der Datenbank darstellen muss. Bei einem notwendigen Datenzugriff ist es nach dieser Archivierungsmethodik erforderlich, den gesamten Datenbestand wiederherzustellen. Schemaveränderungen in der Produktivapplikation lassen sich zudem nicht berücksichtigen, was ein späteres Zurückspielen zusätzlich erschwert, wenn nicht gänzlich vereitelt. Besonders häufig anzutreffen sind in den Unternehmen Eigenentwicklungen. Damit lassen sich Daten aus den Produktivdatenbanken extrahieren, wobei diese Lösungen lediglich auf die bestehende Infrastruktur und Datenbankarchitektur zugeschnitten sind. Wenn eine Eigenentwicklung jedoch unzureichend dokumentiert ist und im Bedarfsfall der Know-how-Träger womöglich durch Stellenwechsel oder auch urlaubs- und krankheitsbedingt nicht zur Verfügung steht, treten häufig Probleme auf. Zudem gestalten sich Weiterentwicklungen, Updates und Anpassungen der Eigenentwicklung oft schwierig. Mit dem Einsatz einer unabhängigen Standardlösung dürften sich die Ansprüche einer revisionssicheren Archivierung wohl am besten abdecken lassen. Eine solche Lösung ermöglicht den Aufbau einer konsistenten Ablagestruktur mit Nutz- und Metadaten sowie ein Archiv ohne Redundanzen durch inkrementelle Archivierung. Ganz besonders von Vorteil gegenüber den anderen Methoden ist dabei, dass sich einzelne archivierte Datenbankeinträge wiederherstellen lassen, ohne dass dies für das Gesamtarchiv notwendig ist. Weiterhin ist es möglich, auch externe Lösungen – zum Beispiel zur Jobsteuerung oder für das Monitoring – anzubinden sowie Strukturveränderungen der Datenbank automatisiert zu berücksichtigen.

Revisionssicherheit muss gegeben sein

Die Nutzung solcher Standard-Tools ist allerdings noch nicht sehr verbreitet. So zeigt beispielsweise eine Befragung, die der Hersteller CSP im Rahmen der Deutschen Oracle Anwender Konferenz DOAG 2011 durchgeführt hat, dass derzeit nur 23 Prozent der Oracle-Anwender solche Standard-Tools zum Auslagern von Datenbanken nutzen. Es wird zudem deutlich: Den meisten Befragten ist gar nicht bewusst, dass ihre bisher eingesetzte Lösung gegen die gesetzlichen Vorgaben verstößt. Speziell im Hinblick auf die vorgeschriebenen Retention-Zeiten lässt sich dies beobachten. Wenn der Anwender zum Beispiel alle Daten vollständig und ausschließlich in der produktiven Datenbank vorhält, dann lassen sich die Daten online jederzeit bearbeiten, manipulieren oder löschen. Gesetzlich gefordert ist jedoch Revisionssicherheit, die nur auf Storage-Systemen mit WORM-Funktion (Write Once Read Many) gegeben ist. Die Aufbewahrungszeiten sind teils durch Gesetze wie dem Handelsgesetzbuch (HGB), der GDPdU, Basel II oder Sarbanes-Oxley Act festgelegt, teils sind sie auch aus internen Gründen vorgegeben. Ein Merkmal einer Standardlösung besteht darin, dass der Archivierungsvorgang die produktive Datenbank regelmäßig entlastet. Ein Storage-System ist dann so konfiguriert, dass sich Dateien innerhalb der Aufbewahrungsfrist weder löschen noch verändern lassen. Das regelmäßige Prüfen der Aufbewahrungsfristen sowie das physische Löschen der betroffenen Dateien nach Ablauf dieser Frist übernimmt hingegen die Datenbankarchivierungslösung in einem automatisierten, periodischen Vorgang. Dass der Anwender die Daten innerhalb der Aufbewahrungsfrist jederzeit wiederherstellen kann, ermöglichen Standardsoftwareprogramme durch die Verwendung offener Standards und Metadaten. Ideal ist der Einsatz von Text- und XML-Dateien, mit denen sich die Daten auch nach langer Zeit in eine Datenbank zurückspielen beziehungsweise einfach migrieren lassen. Unter anderem kann eine solche Lösung neben den reinen Nutzdaten auch zusätzliche Informationen speichern – zum Beispiel wie die Text-Files konkret aufbereitet und welche Separatoren enthalten sind. Werden hingegen die Daten in einem festen Format aus der Datenbank exportiert, dann verhindert dies bei Schemaänderungen der Datenbank das Wiederherstellen. In diesen Fällen ist es erforderlich, die Daten zunächst mit erheblichem Aufwand vollständig zu zerlegen und neu zusammenzusetzen, um sie importieren zu können.

Erhöhte Sicherheit durch Verschlüsselung

Durch die IT-Infrastruktur und die Benutzerverwaltung des Storage-Systems sind archivierte Datenbankinhalte bereits vor unbefugtem Zugriff geschützt. Einige Standardlösungen bieten als zusätzliche Sicherheitsoption die Möglichkeit, sensible Daten nach dem Advanced Encryption Standard (AES) zu verschlüsseln. Dies ist etwa für Unternehmen wichtig, die sensible Daten wie Kreditkarteninformationen oder Personaldaten speichern. Die Verschlüsselung ist der derzeit wirkungsvollste Schutz für diese Daten, da sich archivierte Inhalte nur mit dem passenden Schlüssel lesen lassen. Datenbanken unterliegen im Lauf der Zeit typischerweise Änderungen, häufig durch Unternehmenszusammenschlüsse oder andere Entwicklungen des Unternehmens bedingt. Auch noch so minimale Änderungen bedeuten für eigenentwickelte Lösungen oder einfaches Speichern von Datenbankabzügen, dass sich das Datenbankarchiv nicht mehr ohne aufwändige Bearbeitung zurückspielen und darstellen lässt. Standardlösungen hingegen berücksichtigen durch integrierte Funktionen solche Entwicklungen schon von vornherein. Mit hinterlegter Intelligenz erkennt eine solche Software etwa eine syntaktische Änderung – wie die Umbenennung von Spalten – oder auch semantische Änderungen, wenn beispielsweise ein Wechsel von englischer auf deutsche Schreibweise stattgefunden hat. Derartige Transformationen sollten beim Wiederherstellen der Archivdaten unbedingt handhabbar sein. Fazit Die Datenbankarchivierung stellt aus den genannten Gründen keine reine Pflichterfüllung aufgrund gesetzlicher Vorgaben dar, sondern löst in der Kür auch zahlreiche Herausforderungen, denen sich Unternehmen aufgrund des Datenwachstums und der Schnelllebigkeit der Informationstechnik stellen müssen. Datenbankentlastung, Kostensenkung und die Wiederherstellungsmöglichkeit von Daten im jeweiligen Archivierungszeitraum sind dabei nur die offensichtlichsten Nutzenvorteile.

Ein gutes Datenbankarchiv entspricht den gesetzlichen Vorgaben nach Revisionssicherheit und Zugriffsmöglichkeit.
LANline.

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Fraunhofer-Institute

Matchmaker+