Unterschiedliche Tools, Technologien und Techniken sollen einen maximalen Schutz beim Ausfall von Komponenten gewährleisten, die den Zugriff auf die Daten bedrohen könnten. Hier gilt es, die Vor- und Nachteile der einzelnen Technologien abzuwägen, denn viele mindern die Performance und kosten Geld.
RAID (Redundant Array of Independent Disks) ist eine Möglichkeit, identische Daten an
unterschiedlichen Stellen auf mehreren Festplatten zu speichern, was für Redundanz sorgt. Das
einfachste Modell – Striping oder RAID 0 – bietet keinerlei Redundanz. Es sorgt zwar für eine
bessere Performance, ist aber in keiner Weise ausfallsicher. Wenn nur eine der Festplatten der
Gruppe ausfällt, gehen sämtliche Daten verloren.
RAID 5 bietet hingegen eine Kombination aus Striping und Backup-Paritätsdaten. Die
Paritätsinformationen für Daten und Backup werden auf die Festplatten so aufgeteilt, dass bei
Ausfall einer einzelnen Festplatte deren Daten mithilfe einer mathematischen Operation (XOR) aus
den Backup-Paritätsdaten der restlichen Festplatten wieder hergestellt werden können. Daher führt
RAID 5 im Prinzip ein kontinuierliches Backup aller Daten durch.
RAID 6 ist eine Erweiterung von RAID 5, sodass hierbei bis zu zwei Festplatten in einer Gruppe
ohne Datenverlust ausfallen können. Bei RAID 6 sind zwei mathematische Berechnungen zum
Wiederherstellen der Daten erforderlich. Die erste Paritätsberechnung entspricht der von RAID 5
(XOR), die zweite Paritätsberechnung ist anders und erfordert eine zusätzliche Festplatte Q, was
dieser Implementierung den Spitznamen "P+Q"-Paritätsprüfung eingebracht hat. Einige Anbieter
behaupten, dass mit der Einführung der RAID-6-Technologie – speziell mit ihrer jeweiligen
RAID-6-Implementierung – sämtliche Probleme in Sachen Hochverfügbarkeit von Daten vom Tisch seien.
Es stimmt zwar, dass RAID 6 ein höheres Maß an Schutz bei Ausfällen zweier Festplatten bietet, die
Technik ist aber in vielen möglichen Ausfallszenarien – zum Beispiel bei Benutzerfehlern – nicht
die optimale Lösung für höchstmögliche Datenverfügbarkeit.
In Umgebungen, die unbedingt ein Höchstmaß an Datenverfügbarkeit verlangen, unabhängig von
Kosten oder Performance-Auswirkungen, ist RAID 6 als zusätzliches Feature in einer hochverfügbaren
Speicherlösung durchaus in Betracht zu ziehen. Allerdings darf es beim Thema Datenverfügbarkeit
nicht nur um den RAID-Level gehen, man muss auch die Nachteile von RAID 6 berücksichtigen.
RAID 6 wird am häufigsten als Schutz gegen den "Ausfall zweier Festplatten"
betrachtet. Damit bietet RAID 6 zwar in der Tat das höchste Maß an Schutz vor Festplattenausfällen
aller RAID-Level, ist aber trotzdem noch nicht allzu weit verbreitet. Nur wenige Unternehmen sind
bisher bereit, die erforderlichen Extrakosten zu zahlen oder die Performance-Nachteile in Kauf zu
nehmen, nur um sich gegen den relativ seltenen Fall zu schützen, dass zwei Festplatten gleichzeitig
ausfallen.
Die Zunahme der Kapazitäten von Festplatten und die daraus folgenden längeren
Zeiten, die für eine Wiederherstellung der Daten der ausgefallenen Festplatte auf einer
Ersatzfestplatte erforderlich sind, führen aber zunehmend zu der Befürchtung, dass während der
lange dauernden Wiederherstellung der ersten Festplatte eine zweite ausfallen könnte. Solche
Befürchtungen nehmen seit Einführung von SATA-Festplatten (Serial ATA) mit hoher Kapazität sogar
noch zu. SATA-Festplatten erfordern wegen ihrer schlechteren Performance und ihrer höheren
Kapazitäten längere Wiederherstellungszeiten als Fibre-Channel-Festplatten. Darüber hinaus gelten
SATA-Festplatten als weniger zuverlässig als Fibre-Channel-Festplatten, sodass sie mit höherer
Wahrscheinlichkeit ausfallen. Tatsächlich ist ein gleichzeitiger Ausfall zweier Festplatten immer
noch ein extrem seltenes Ereignis. Daher sollten es sich Unternehmen gut überlegen, ob sie bereit
sind, die mit RAID 6 verbundenen Kosten in Kauf zu nehmen, um sich gegen ein unwahrscheinliches
Szenario zu schützen.
Ein potenzieller Vorteil von RAID 6 ist der Schutz vor einem unkorrigierbaren
Fehler während einer Wiederherstellung. Das beste Beispiel für einen unkorrigierbaren Fehler ist
ein nicht wiederherstellbarer Lesefehler, der aber vor einem Festplattenausfall entdeckt und
korrigiert werden kann. Daher reduziert sich die Wahrscheinlichkeit für ein solches Szenario.
Im Unterschied zu RAID 10 und RAID 5, die unabhängig vom Hersteller identisch
implementiert werden und sich als Technologien bewährt haben, gibt es eine Vielzahl von
Möglichkeiten zur Implementierung von RAID 6 in einem Speichersystem – und nicht alle
RAID-6-Implementierungen sind gleich. RAID-6-Methoden unterscheiden sich deutlich von Anbieter zu
Anbieter, ebenso die damit verbundene Performance und Nutzbarkeit.
Die Implementierung mit doppelten Paritätswerten von RAID 6 schränkt manchmal die Zahl der
Festplatten im RAID-System auf eine Primzahl ein. RAID 5 hingegen unterstützt in marktgängigen
Systemen drei bis 30 Festplatten in einem System und hat keine Probleme damit, die Zahl der
Festplatten an den vorhandenen Einsatzbereich anzupassen. Diese Fähigkeit kann RAID 6 nicht immer
bieten.
Im Vergleich zu RAID 10 und RAID 5 ist RAID 6 der RAID-Level mit der schlechtesten Performance.
Unter normalen Umständen ist die Lese-Performance für all diese Level zwar vergleichbar, aber die
Schreib-Performance weicht erheblich voneinander ab. Und bei Wiederherstellungen, wenn das System
sowieso schon nicht mit voller Kraft läuft, werden die Unterschiede sogar noch drastischer:
Wahlfreie Schreibvorgänge: Sowohl P+Q- als auch DP-RAID-6-Implementierungen
sind ungefähr 50 Prozent langsamer als RAID 5 aufgrund von Berechnung und Schreiben der
zusätzlichen Redundanzdaten.
Sequenzielle Schreibvorgänge: DP-RAID-6-Implementierungen sind bis zu 40
Prozent langsamer als RAID 5, während P+Q RAID 6 ungefähr zehn Prozent langsamer ist als RAID
5.
Wiederherstellen einzelner Festplatten: P+Q RAID 6 ist ungefähr so schnell wie
RAID 5, DP RAID 6 ist am langsamsten.
Bei Anwendungen, bei denen es auf die Performance ankommt, oder solchen, bei
denen ein bestimmter Performance-Grad eingehalten werden muss, muss man wissen, welche Auswirkungen
auf die Performance eine Implementierung von RAID 6 mit sich bringt. Aufgrund des zweiten
Paritätswertes führen RAID-6-Konfigurationen insgesamt mehr I/O-Operationen bei Schreibvorgängen
und Wiederherstellungen aus. Daher leidet die RAID-6-Performance in solchen Situationen im
Vergleich zu RAID 5 und RAID 10.
Benutzer von RAID 5 haben sich inzwischen daran gewöhnt, RAID-Systeme
beliebiger Größe erstellen zu können. Einige Benutzer verwenden gerne eine 4+1-Konfiguration (vier
Datenfestplatten für jede Paritätsfestplatte), andere arbeiten lieber mit 12+1-Systemen. Die
meisten Systeme unterstützen RAID-Systeme von kleinen (2+1) bis zu großen Konfigurationen (15+1),
wobei einige Systeme sogar 29+1 anbieten. Dual Parity RAID-6-Lösungen bieten häufig nicht dasselbe
Maß an Flexibilität. Viele Dual-Parity-Implementierungen erfordern, dass die Anzahl der Festplatten
in einem RAID-System eine Primzahl ist oder in einigen Fällen eine Primzahl minus eins. Damit kann
die Größe eines RAID-Systems auf fünf (drei Datenfestplatten und zwei Paritätsfestplatten), sieben
(5+2), elf (9+2) oder dreizehn Festplatten (11+2) etc. beschränkt sein. Das ist bei Dual Parity
RAID 6 zwar nicht immer der Fall, aber wenn die Anzahl der Festplatten im RAID-System keine
Primzahl ist, muss die Methode zur Berechnung der vertikalen Stripe-Parität geändert werden, um
alle möglichen Gruppengrößen zu bedienen. Dies führt zu zusätzlicher Komplexität der Algorithmen
und schlägt sich noch einmal negativ auf die Performance nieder. P+Q-RAID-6-Implementierungen
bringen keinerlei Einschränkungen hinsichtlich der Gruppengröße mit und unterstützen damit auch das
Hinzufügen einzelner Festplatten (n+2), wie es derzeit auch bei RAID 5 der Fall ist.
Während RAID 6 mehr nutzbare Kapazität bietet als RAID 1, wo die Hälfte der Rohkapazität
Paritätszwecken dient, ist die nutzbare Kapazität bei RAID 6 doch geringer als bei RAID 5. Eine
Konfiguration, die fünf Datenfestplatten im RAID-System benötigt, braucht bei RAID 5 (5+1) 16
Prozent der Rohkapazität des Systems für die Paritätsdaten, während es bei RAID 6 29 Prozent sind.
Außerdem führt das Hinzufügen nur einer zusätzlichen Festplatte zum RAID-System bei
RAID-6-Konfigurationen zu bis zu 17 Prozent mehr Festplattenausfällen, was mehr Wiederherstellungen
bedingt und damit eine längere Zeitspanne mit schlechterer Performance. Anbieter von
RAID-6-Lösungen werden damit argumentieren, dass man auf sichere Weise größere RAID-Systeme
zusammenstellen kann, um den Overhead aufgrund der Paritätsdaten zu verringern. Aber dieser Ansatz
bringt noch andere Auswirkungen mit sich, denn größere RAID-Systeme sind anfälliger für
Festplattenausfälle und lassen sich langsamer wiederherstellen, was längeres Arbeiten bei
schlechterer Performance bedeutet.
Der folgende Abschnitt ist für diejenigen gedacht, die eine detaillierte technische Beschreibung
von RAID-6-Implementierungen wünschen. RAID 6 ist ein System zweier unabhängiger linearer
Gleichungen. Im Prinzip gibt es zwei Möglichkeiten, ein RAID-6-System zu erstellen:
Einen rein mathematischen Ansatz: Dazu wählt man zwei unabhängige Systeme von
Koeffizienten, die mit den Daten multipliziert werden.
Die Daten sollten aus unterschiedlichen Sätzen gewählt werden, sodass man das
System jederzeit per Iteration auf eine einzelne, wenn auch komplexe Gleichung mit nur einer
Variablen reduzieren kann.
Die meisten klassischen P+Q-Implementierungen bedienen sich des ersten Verfahrens (Galois-Feld).
Das Problem ist die Auswahl der geeigneten Faktoren (Polynom) auf eine "einfach zu benutzende"
Weise. Das erste Polynom ist sehr einfach: 0x1. Damit lautet die erste Gleichung ebenso wie bei
RAID 5: Die Festplatte P speichert die Paritätsdaten. Alle vorhandenen Hardwarebeschleuniger für
RAID 5 werden auch hier funktionieren. Das zweite Polynom ist allerdings komplizierter und
erfordert einen erheblichen Rechenaufwand. In jedem Fall handelt es sich dabei um eine "
XOR-Operation mit einem Multiplikator, was es für RAID 5 zwar nicht gibt, aber mit kleinen
Modifikationen der XOR-Hardware erzielt werden kann.
Die zweite Methode zur Implementierung ist Dual Parity (auch als Double Parity bezeichnet), die
die üblichen "horizontalen" Paritäts-Streifen mit einem zweiten, "vertikalen" Paritäts-Streifen
kombiniert. Jeder vertikale Streifen nutzt maximal einen horizontalen Streifen aus jeder
Festplatte. Dank zweier unterschiedlicher Paritätssätze kann jedes RAID-System beim Ausfall von
einer oder zwei Festplatten wiederhergestellt werden. Horizontale und vertikale Paritätsdaten
werden auf dieselbe Weise berechnet wie bei heutigem RAID 5 (per XOR). Die aufwändigen Algorithmen,
die für de Berechnung der vertikalen Parität erforderlich sind, sowie komplizierte Fehler- und
Ausnahmebehandlung führen allerdings dazu, dass solche RAID-6-Implementierungen deutlich langsamer
sind als P+Q RAID 6.
Je nachdem, wo die Daten gespeichert sind, können mehrere Iterationen erforderlich sein, um die
Daten wiederherzustellen: mindestens drei, maximal so oft, wie es dem Quadrat der Anzahl der
Festplatten entspricht. Im Prinzip liefert ein Dual Parity RAID 6 unter allen Bedingungen eine
zufriedenstellende Leistung, aber das Wiederherstellen der Daten bei einem Ausfall zweier
Festplatten führt zu nicht mehr akzeptablen Performance-Einbrüchen. Als Nebeneffekt kann es sogar
zu einer Überlastung des Arbeitsspeichers durch den Adapter kommen, was noch einmal zu Lasten der
Performance geht. Es gibt zwar Unterschiede zwischen den einzelnen Anbietern, aber die
P+Q-Implementierung gilt als Branchenstandard, weil sie unter allen Bedingungen gleichermaßen
Datenintegrität und Performance garantiert. LSI und Intel haben gemeinsam an der Standardisierung
der MDS-Polynome für die DDF-Spezifikation (Disk Data Format) gearbeitet, die von der SNIA (Storage
Networking Industry Association) verwaltet wird und inzwischen beim INCITS (International Committee
for Information Technology Standards) eingereicht wurde. Für DP-Implementierungen gibt es keinen
Standard, sodass diese sich je nach Anbieter stark voneinander unterscheiden.
RAID 1 und RAID 5 sind bewährte Technologien mit brancheneinheitlichen Implementierungen, die
seit 15 Jahren in Produktions-Speichersystemen im Einsatz sind. Anbieter und Benutzer wissen, wie
diese RAID-Level implementiert werden und wie man optimale Performance, Kapazität und Verfügbarkeit
mit diesen Konfigurationen und Lösungen erzielt. RAID 6 andererseits ist relativ neu und kann auf
unterschiedliche Weisen implementiert werden.
Kontinuierliche Datenverfügbarkeit ist für den Erfolg von Unternehmen von entscheidender
Bedeutung. Daher müssen Storage-Systeme über eine Vielzahl von Funktionen verfügen, um eine solche
Hochverfügbarkeit bieten zu können. Mit nur einem einzigen Feature wird dieses Ziel nicht zu
erreichen sein. Vielmehr ist eine strategische Kombination aus Features, Funktionalität und
Konfigurationsmöglichkeiten notwendig, um für ein hochverfügbares Storage-System zu sorgen.