Auf dem Weg zur erinnerungslosen Gesellschaft?

Langzeitarchivierung

18. Dezember 2006, 1:15 Uhr | Mika Kotro/mw Mika Kotro ist als Marketing Manager für EMC Deutschland tätig.

Langzeitarchivierung war schon für die alten Ägypter ein Thema. Ihre Strategie war so gut, dass die Informationen, die sie in Stein gemeißelt haben, auch nach zwei Jahrtausenden noch verstanden werden. Heute laufen wir Gefahr, gespeicherte Daten schon nach wenigen Jahren nicht mehr nutzen zu können. In Zeiten, in denen durch die zunehmende Digitalisierung immer mehr Informationen erfasst und gespeichert werden, ist eine Archivierungsstrategie wichtiger denn je.

Die Firmen haben ein erhebliches Eigeninteresse an erfolgreichen Archivierungsstrategien.
Schließlich wollen sie sicherstellen, dass ihre Unterlagen auch in zehn, 15 oder 50 Jahren noch
verfügbar und lesbar sind.

So wie Unternehmen und Behörden geschäftskritisches speichern und archivieren, haben auch
Bibliotheken und Museen damit begonnen, elektronische Abbildungen ihrer kulturellen Schätze
dauerhaft zu speichern, um wenigstens diese vor Katastrophen wie dem Brand der Herzogin Anna Amalia
Bibliothek (HAAB) zu schützen. In einem solchen Kontext wird Unternehmen ebenso wie
wissenschaftlichen Einrichtungen bewusst, wie flüchtig digitale Daten sind und wie groß die Gefahr
ist, zu einer "erinnerungslosen Gesellschaft" zu werden. Aufgrund ihres Auftrags haben Bibliotheken
ein besonderes Interesse an dem Thema digitale Langzeitarchivierung. Die Weimarer Herzogin Anna
Amalia Bibliothek (HAAB) scannt ihre Kulturschätze ein und stellt Sie in verschiedenen
Qualitätsstufen für interessierte Laien, Forschungszwecke und als Druckvorlage für Nachdrucke
bereit. Ziel des Projekts ist, die wichtigsten Werke im Internet verfügbar zu machen und
gleichzeitig die kostbaren Originale vor übermäßiger Benutzung zu schützen.

Die dauerhafte Archivierung von digitalen Inhalten ist eine Wissenschaft für sich. Elektronisch
gespeicherte Informationen können ohne ein geeignetes Lesegerät nicht dargestellt werden. Im
Gegensatz zu gedrucktem Material, dass lediglich dem zeitlich bedingten Materialverfall unterliegt,
muss bei digitalen Dokumenten immer auch der technologische Fortschritt berücksichtigt werden.

Neue Anwendungen oder auch nur Softwareversionen sowie Innovationen bei Speichermedien erfordern
kontinuierliche Aufmerksamkeit. Es braucht folglich eine Strategie zur Migration oder Emulation
sowie offene Formate. Hier sind die Hersteller von Anwendungen und Speicherinfrastrukturen
aufgefordert, an der Entwicklung von einheitlichen technischen Mitteln, Schnittstellen,
Lieferverfahren und Methoden mitzuarbeiten, die den Bedürfnissen der langfristigen Archivierung von
digitalen Inhalten gerecht werden.

Dokumentenmanagement tut not

Die langfristige Aufbewahrung digitaler Inhalte ist ein äußerst dynamischer Prozess, der schon
mit der richtigen Erfassung der Bits und Bytes beginnt und sich über deren Strukturierung,
Speicherung, Verteilung bis hin zur Archivierung zieht. Ohne geeignete Dokumentenmanagementsysteme,
sprich Enterprise Content Management (ECM), geht es deshalb nicht. Heute gilt es, den Medienmix im
Unternehmen zu konsolidieren und mit zukunftsweisenden Technologien skalierbar zu halten. Offene
Systeme und Standardformate sind dabei nur eine Voraussetzung für die langfristige Lesbarkeit
wichtiger Informationen. Doch wollen diese Daten in komplexen Umgebungen auch wieder gefunden
werden. Zusätzlich müssen Generationen von Softwareversionen und Betriebssystemen verwaltet
werden.

Während jedoch die passende Softwarelösung für Unternehmen oder auch Bibliotheken selten ein
Problem ist, stellt die Hardware insbesondere letztere vor besondere Herausforderungen. Die
begrenzte Haltbarkeit heute gängiger Medien zwingt die Verantwortlichen zu teils umständlichen
Verfahren, deren Ergebnis sie selbst mit Skepsis betrachten. So beschreibt Dr. Michael Knoche,
Direktor der HAAB, als Beispiel ein Verfahren, das in seiner Einrichtung zum Einsatz kommt: "Wir
belichten die digitalisierten Daten inklusive Metadaten auf dauerhaftem Mikrofilm aus, sodass in
Zukunft unabhängig von der heutigen Hardware diese Daten wieder ausgelesen und nachgebaut werden
können." Diese Mikrofilme werden im Rahmen des Zivilschutzgesetzes im zentralen Bergungsort der
Bundesrepublik im Schwarzwald archiviert. Ein solches Verfahren funktioniert jedoch nur bei
statischen Dokumenten wie Büchern. Bei interaktiven Anwendungen wie Webseiten mit angeschlossenen
Datenbanken stößt es an seine Grenzen. Die Hersteller sind daher gefordert, Speicherplattformen zu
entwickeln, die einerseits die Konsistenz der Daten dauerhaft sichern, gleichzeitig jedoch auch
einen einfachen Migrationsprozess auf neue Speichertechnologien erlauben.

Eine Frage des Formats

Mindestens ebenso gravierend und wichtig bei der Archivierung von Informationen ist jedoch die
Frage des Formats, in dem digitale Inhalte gesichert werden sollen. Hier ist
Herstellerunabhängigkeit ganz entscheidend. Nur so lässt sich vermeiden, dass Dokumente irgendwann
nicht mehr gelesen werden können, weil der Hersteller die Unterstützung für ein Format aufgekündigt
hat. Der eigentliche Prozess beginnt daher bei der Erstellung unstrukturierter Dokumente durch
einen Autoren oder der Erfassung durch Scannen, Bildbearbeitung oder Formularverarbeitung.
Natürlich ist es sinnvoll, alle Dokumente in Standardformaten wie XML, TIFF Group 4, Adobe PDF oder
JPEG zu speichern und zu archivieren. Gleichzeitig sollte auch der bereits abgelegte
Informationsbestand auf seine Formatvielfalt hin überprüft werden. Sollen Dokumenten ohnehin der
Archivierung zugeführt werden, ist eine frühe Konvertierung in den ISO-zertifizierten
Archiverungsstandard PDF/A sinnvoll, der aus dem weithin bekannten PDF-Format von Adobe
hervorgegangen ist.

Die Stecknadel im Heuhaufen

Egal ob im Unternehmen oder im Bibliotheksarchiv, alle Inhalte, die einmal in digitaler Form
vorliegen, müssen intelligent geordnet werden, damit sie auch irgendwann einmal wieder gefunden
werden können. Erfasste Dokumente sollten mithilfe von Metadaten klassifiziert und kategorisiert
werden. Informationen wie Dokumententyp, Autor, Zugriffsrechte oder Verfallsdatum strukturieren die
Informationsflut und machen sie über Anwendungen hinweg recherchierbar. Bei größeren Unternehmen
mit hohem Datenaufkommen kann diese Phase schnell zur Mammutaufgabe werden. Eine große Hilfe sind
hier Softwaremodule, die die Klassifizierung der Unternehmensdaten automatisieren. Die Ergebnisse
der Klassifizierung dienen dann zur Kategorisierung oder als Suchbegriffe, die in die Metadaten der
Inhalte einfließen. Viele Anwender tun sich schwer damit, die Metadaten bei der Erzeugung von
Inhalten konsistent einzugeben. Das schränkt die Wiederauffindbarkeit und programmierte
Verarbeitung von Inhalten erheblich ein. Ein entsprechendes Programm schlägt bei der
Datenerstellung automatisch Metadaten vor, die der Anwender annehmen oder ablehnen kann.

Magnetbänder sind weiterhin populär

Die absolute Anzahl der Speichermedien sollte so klein wie möglich gehalten werden, um die
Administration zu vereinfachen und die Systeme fit für die Anforderungen der Zukunft zu machen.
Magnetbänder sind als Archivdatenträger weiterhin populär. Mit Einführung der CAS-Technologie
(Content-Addressed-Storage) vor einigen Jahren drängen auch die Festplattenhersteller in den
Archivierungsmarkt. CAS archiviert langlebige, gleich bleibende Informationen auf Plattenbasis
revisionssicher. Direkt mit Content-Management-Systemen gekoppelt, erlaubt ein solches
Speichersystem den schnellen Onlinezugriff auf Archivdaten. Im Vergleich mit den Tape-Klassikern
verbrauchen die CAS-Archive zwar mehr Strom und sind aufgrund ihrer Softwareintelligenz
wartungsanfälliger. Vorteile wie der RAID-Schutz der Archivdaten, die automatische Migration auf
neue Hardwaregenerationen, die programmierbare Löschung von Informationen, integrierte
Rechteverwaltung sowie die höhere Performance stechen Tape-Libraries allerdings rasch aus. Hinzu
kommt, dass Anwender, die wenig Stellplatz zur Verfügung haben oder diesen mieten müssen, bei
Plattenarchiven nur mit höchstens zwei 19-Zoll-Gehäusen im Rechenzentrum kalkulieren müssen.

Nichts ist so beständig wie der Wandel

Wer lange etwas von seinen Daten haben möchte, muss sein Informationsmanagement kontinuierlich
auf dem aktuellen Stand halten. Sonst ist die digitale Erinnerungslosigkeit vorprogrammiert:
Informationen können nicht in angemessener Zeit oder aufgrund mangelnder Indizierung gar nicht
wieder aufgefunden werden.

Die ägyptische Methode

Die eingangs erwähnte ägyptische Methode der Langzeitarchivierung ist für flüchtige, digitale
Informationen leider nicht praktikabel. Viel Augenmerk sollten Unternehmen daher auf die
Skalierbarkeit von Formaten, Anwendungen und Systemen legen. Denn um die regelmäßige Nachrüstung
und Modernisierung der vorhandenen Medien und Infrastruktur kommt keine IT-Abteilung herum.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+