E-Mail- und Archivsystem sinnvoll verbinden

Messaging und Storage als große Koalition

18. November 2005, 18:31 Uhr | Jürgen Wege/wj Jürgen Wege ist Vorstand und CEO bei Group Technologies in Karlsruhe

Beim Archivieren geschäftlicher E-Mails spricht das Gesetz eine deutliche Sprache. Mit der praktischen Umsetzung der Vorschriften allerdings tun sich viele Unternehmen schwer. Ein Grund ist häufig eine mangelhafte Organisation der Prozesse zwischen E-Mail- und Archivsystem.

In Deutschland berühren verschiedene Vorschriften die Aufbewahrungspflicht von E-Mails, zum
Beispiel die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU) und die
Grundsätze ordnungsmäßiger DV-gestützter Buchführungssysteme (GoBS). Sie fordern unter anderem die
unveränderte und unveränderbare Aufbewahrung der Dokumente sowie ihre schnelle Wiederauffindbarkeit
und Darstellung im Originalzustand. Um diese Vorgaben umzusetzen, nutzen viele Unternehmen
spezielle Archivsysteme. Sie protokollieren die Archivierungsvorgänge, übergeben die Dokumente an
Speichersysteme und sorgen via Indizierung und Verschlagwortung für die Wiederherstellung der
Nachrichten.

Was die Archivierung allerdings problematisch macht, ist das Zusammenspiel zwischen Archiv- und
E-Mail-System. Die Archivlösungen ziehen die Nachrichten in der Regel direkt aus den
Empfängerpostfächern.

Ob diese dort unverändert im Original vorliegen oder bereits vom Empfänger modifiziert worden
sind, beachtet das System nicht. Die E-Mails durchlaufen dann den Archivierungsvorgang zwar
korrekt, aber die Grundlage stimmt nicht, weil der unveränderte Zustand der Nachricht seit dem
Eintreffen auf dem Mailserver oder dem Versand bereits nicht mehr gewährleistet ist. So hat die
ganze Archivierung keinen Wert.

Pflichtenheft

Aus diesem Grund muss der gesamte gesetzeskonforme Archivierungsvorgang bereits beim
E-Mail-System und dessen Funktionen ansetzen. Die Nachrichten müssen dort so aufbereitet werden,
dass alle organisatorischen Aspekte geregelt sind und die Manipulationssicherheit vor der Übergabe
an das Archivsystem und der Zustellung an den Empfänger hergestellt wird.

Der E-Mail-Seite fallen dabei verschiedene Aufgaben zu. Sie muss folgendes regeln:

Nur als geschäftswichtig definierte Nachrichten sollen in die Archivierung
gelangen,

als gefährlich oder unerwünscht eingestufte Mails (Viren, Spam) sind zu
filtern,

Nachrichten sind inhaltlich zu kategorisieren,

auf verschlüsselte E-Mails muss zugegriffen werden können und

für das Archivierungssystem zur Indexierung nötige Metadaten sind
aufzulösen.

Da gängige Messaging-Plattformen wie Microsoft Exchange und Lotus Domino hierfür nicht den
nötigen Funktionsumfang mitbringen, fallen diese Aufgaben in die Verantwortung ergänzender
Lösungen.

Nichts ohne Regel

Das A und O bei den beschriebenen Vorgängen ist ein globales Regelwerk für das Zusammenspiel
zwischen E-Mail-Management- und Archivsystem. Die wichtigste Regel besagt, dass der Empfänger nur
eine Kopie ins Postfach geschickt bekommt, während das Original am Mailserver zur weiteren
Bearbeitung einbehalten und von dort direkt an das Archivsystem übergeben wird. Für die
Revisionssicherheit ist es dann irrelevant, was mit der Nachricht im Empfängerpostfach
geschieht.

Dieses Prinzip hat zusätzliche willkommene Konsequenzen. Große E-Mail-Anhänge beispielsweise
lassen sich vom Hauptteil der E-Mail trennen und direkt an das Archivsystem übergeben (Mail
Stubbing). Der Empfänger erhält dann den Mailtext mit einer Verknüpfung, die zum Speicherort des
Anhangs verweist. Auf diese Weise gelangen große Dateien gar nicht erst ins Mailsystem.

Die wichtigste Aufgabe des Regelwerks ist die Unterscheidung und Begrenzung bei der
Archivierung. Die wenigsten Unternehmen müssen, können und wollen E-Mails unterschiedslos über
einen längeren Zeitraum vorhalten, denn Speicherplatz ist knapp und kostbar. Ein sinnvolles
Kriterium zur Unterscheidung ist die Trennung nach Nutzergruppen – so wäre es zum Beispiel möglich,
nur E-Mails an und von "Buchhaltung", "Vertrieb", "Management" der Archivierung zuzuführen. Eine
andere Regel könnte die Archivierung auf Nachrichten mit dem Label "Rechnung" beschränken, die für
das ERP-System wichtig sind. Auf diese Weise lassen sich Netzwerklast und Speicherbelegung auf das
tatsächlich Nötige begrenzen.

Klassifizierung nach Inhalten spart Aufwand

Neben der Spam- und Virenprüfung leistet die E-Mail-Klassifizierung wichtige Vorarbeit für die
Archivierung. Ziel ist es, E-Mails nach inhaltlichen Kriterien zu unterscheiden. Dafür stehen heute
leistungsstarke Verfahren zur Verfügung. Die von Group Technologies entwickelte Content Recognition
Engine (Core) etwa basiert auf der Klassifizierungsmethode Support Vector Machines (SVM). Die
betrachteten Texte werden dabei als Vektoren im Raum dargestellt; ihre Nähe zu einer definierten
Bezugsebene entscheidet, ob das Dokument der einen oder anderen Kategorie zufällt. Damit lassen
sich E-Mail-Inhalte kontextabhängig bewerten und auf dieser Basis um passende Informationen aus
CRM-, ERP-Systemen und Produktdatenbanken automatisiert ergänzen.

Die inhaltliche Klassifizierung erleichtert die für die Archivierung und Wiederherstellung
wichtige E-Mail-Indizierung. Zunächst wird die analysierte Kategorie den formalen Vorgaben für
Exchange und Domino entsprechend in die E-Mail eingetragen. Das Archivsystem erhält dann die
Anweisung, genau dieses Feld auszulesen. Anhand der Informationen erkennt das System, welchen
Indexeintrag es erzeugen muss. Damit lässt sich die E-Mail auch schnell wieder finden.

Damit ist ein Engpass in gängigen Archivierungskonzepten beseitigt. Dort fällt es dem
Archivsystem selbst zu, die Relevanz der Aufbewahrung zu bewerten und die Metadaten zu erstellen.
Das ist ein ressourcenstrapazierender Vorgang: Vor der Extraktion durch das Archivsystem werden die
Nachrichten über die Journaling-Funktion von Exchange oder Domino aufgezeichnet und in einem
speziellen Archiv vorgehalten, was viel Speicherplatz kosten kann. Hinzu kommt die Netzbelastung,
wenn die E-Mails ins Archivsystem überspielt werden. Nach Angaben von Microsoft müssen große
Unternehmen bei Nutzung der Journaling-Funktion mit den doppelten Mailbox-Ressourcen kalkulieren,
um den Performance-Level einigermaßen zu halten.

Probleme mit verschlüsselten E-Mails

Ein anderer Aspekt, der bei der E-Mail-Archivierung oftmals Schwierigkeiten bereitet, ist der
Umgang mit E-Mail-Verschlüsselung. Die gängige Methode, Nachrichten Client-seitig zu verschlüsseln,
ist für die regelbasierte Archivierung kontraproduktiv. Einmal chiffriert, steht die Mail nicht
mehr für die Spam-, Viren- und Inhaltsprüfung zur Verfügung. Deshalb sollte auch dieser Vorgang
zentral ablaufen (zu ähnlichen Überlegungen im Bereich der Dateiverschlüsselung siehe den Beitrag "
Transparente Dateiverschlüsselung" in LANline Spezial V, S. 10). Da es nicht notwendig ist, alle
E-Mails verschlüsselt zu archivieren, bietet sich auch hier die Trennung nach Sender- und
Empfängergruppen an. Zum Beispiel kann definiert werden, dass jede Nachricht aus der
Kreditabteilung einer Bank vor der Archivierung standardmäßig zu verschlüsseln ist.

Über die serverseitige Verschlüsselung lassen sich Beziehungen zwischen Sender/Empfänger und
angewandtem Kryptoverfahren herstellen. Diese Beziehung ist wichtig, da die etablierten Methoden
PGP (Pretty Good Privacy) und S/MIME (Secure Multipurpose Internet Mail Extensions) nicht
kompatibel zueinander sind. Verschlüsselt die eine Seite mit PGP, muss es die andere auch.
Ansonsten wäre die E-Mail nicht lesbar und nicht nach inhaltlichen Kriterien archivierbar. Ein
Beispiel: Mitarbeiter kommunizieren mit dem Unternehmen vom Home-Office aus über das Internet.
Dabei nutzen sie unterschiedliche Mail-Clients und Provider. Für solche Fälle eignet sich PGP
besonders gut. Die entsprechende Anweisung im zentralen Regelwerk kann lauten: "Kommt eine E-Mail
von Mitarbeiter X@Provider Y herein, wird sie mit PGP-Schlüssel 1 entschlüsselt". Dann ist die
Nachricht etwa für die Inhaltprüfung nutzbar, die wiederum über die Archivierungsrelevanz
entscheidet. Analog lassen sich ausgehende Nachrichten für Verschlüsselung und Archivierung
vorbereiten: "Geht eine E-Mail an den Lieferanten Z@Domäne Z, wird sie mit S/MIME-Schlüssel 2
verschlüsselt und in Ablage A kopiert". Auch hier sind alle Verwaltungsschritte erledigt, ehe die
Nachricht mit dem Archivsystem in Berührung kommt.

Fazit

Nicht nur der immer engere rechtliche Rahmen, auch der Nachrichtenumfang an sich machen eine
durchgängige Systematik bei der E-Mail-Archivierung unerlässlich. Nach Angaben der Marktforscher
von Lünendonk werden E-Mails dieses Jahr im Schnitt 38 Prozent mehr Speicher belegen als 2004. Vor
diesem Hintergrund ist die systematische und Ressourcen schonende E-Mail-Archivierung keine nette
Zugabe mehr, sondern einer der wichtigsten IT-Prozesse überhaupt.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+