RAID: Speicher auf Flash- und PCIe-Basis

Alternative für den schnellen Datenzugriff

31. Oktober 2012, 7:00 Uhr | Thomas Pavel/pf, Director of Channel Sales bei LSI

In der Vergangenheit hat es die Evolution der RAID-Technik es geschafft, mit neuen Anforderungen Schritt zu halten. Eine hohe Datenrate ließ sich dabei letztlich durch eine immer höhere Zahl klassischer Festplatten erreichen. Doch in Zeiten von Big Data, Cloud Computing und Multimedia gelangt dieser Ansatz an seine Grenzen. Flash-basierende RAID-Controller zeigen neue Lösungswege auf.Die klassischen RAID-Techniken ringen heute vergeblich darum, mit der Leistungssteigerung auf der Prozessorseite mitzuhalten. Denn für CPUs sind inzwischen Schreibgeschwindigkeiten auf L1-Cache ("Level 1") von einer Nanosekunde, von zehn Nanosekunden auf L2-Cache und 100 Nanosekunden zum Hauptspeicher normal. Dies ist jedoch signifikant schneller als die zehn Millisekunden Schreibgeschwindigkeit zu Tier-1-Speicher oder die 20 Millisekunden zu Tier-2- und Nearline-Speicher. Dort ergeben sich folglich Latenzzeiten, die bis zum Faktor 100.000 höher liegen. Die Explosion von Datenmenge und Datenstrom im Netzwerk bringt traditionelle RAID-Storage-Infrastrukturen dabei an ihre Grenzen. Es entsteht ein Flaschenhals, der die Geschwindigkeit von Applikationen ausbremst und Organisationen hindert, ihre Daten sinnvoll zu nutzen. Die Engpässe bei den Datenraten für unternehmenskritische Applikationen sind Grund genug, sich mit dem Thema RAID und dessen neuester Entwicklungsstufe genauer zu befassen. Für viele Beobachter stehen heute Solid State Drives (SSDs) oben auf der Liste, wenn es darum geht, die eklatante Lücke zwischen Prozessor- und Speicherleistung zu schließen. Für SSDs sprechen im Vergleich zu traditionellen Festplatten vielfach kürzere Zugriffszeiten, höhere Datentransferraten, geringere Latenzzeiten und eine konstantere Leseleistung. Aufgrund der hohen Preise ist der Austausch der gesamten Speicherarchitektur mit SSDs jedoch unmöglich. Folglich würde eine ökonomisch vertretbare Alternative darin bestehen, die performante und stromsparende Flash-Technik, auf der SSDs basieren, an geeigneterer Stelle in die IT-Infrastruktur zu integrieren.

Die Evolution von RAID
Bereits in der Vergangenheit bremsten Performance-Probleme die IT-Infrastruktur aus, für die kreative Lösungen gefragt waren. Die RAID-Technik spielte dabei für Speicherzugriffe eine entscheidende Rolle. Die Entwicklung von RAID begann zwar bereits 1978, als Norman Ken Ouchi von IBM ein Patent einreichte für ein "System, um Daten in einer defekten Speichereinheit zu retten? - das letztlich RAID 5 werden sollte. Rund neun Jahre später kamen Wissenschaftler der University of Berkeley auf die Idee, mehrere Festplatten in einer einzigen logischen Einheit zusammenzubringen, die sie in einem Aufsatz mit dem Titel "Argumente für die redundante Anordnung von günstigen Festplatten? veröffentlichten. Im Mittelpunkt ihres Artikels stand weniger das Thema Datensicherheit, sondern der Ansatz, mit den Disk Arrays Herausforderungen bei der I/O-Leistung zu lösen. RAID hatte damit eine neue, sinnvolle Zielrichtung jenseits der Aufgabe, für Redundanz im Speicher zu sorgen.
Dabei haben sich zahlreiche RAID-Modelle, die heute als RAID-Level bekannt sind, über die Jahre hinweg entwickelt. RAID 0 verbesserte zwar die Leistung, tolerierte allerdings keine Fehlfunktionen, und RAID 1 machte es möglich, Daten auf zwei identischen Platten zu spiegeln. Ein weiterer Schritt waren die Synchronisation der Plattenspindeln sowie die sequenzielle Speicherung auf einer Festplatte durch RAID 2 und RAID 3. Parallele I/O-Transaktionen auf voneinander unabhängigen Festplatten ließ sich mit RAID 4 erreichen, jedoch litt dieses Konzept daran, dass die Paritätsdaten auf einer gesonderten Platte gespeichert waren. RAID 5 speicherte gleiche Daten parallel, sodass der Ausfall einer Festplatte nicht mehr zu Datenverlusten führte und verteilte Paritätsinformationen über die vorhandenen Platten. Erst RAID 6 bot komplette Fehlertoleranz sogar beim Versagen von zwei Platten, was den Einsatz größerer RAID-Gruppen für hochverfügbare Systeme erleichterte.

RAID auf Hard- oder Softwareebene
Generell lässt sich das Verteilen von Daten über RAID auf Soft- oder Hardwareebene realisieren. Softwarebasierendes RAID läuft gewöhnlich über das Betriebssystem. Server-Betriebssysteme, die logisches Volume-Management bieten, unterstützen normalerweise auch mehrere verschiedene RAID-Level und damit zumindest eine rudimentäre RAID-Funktionalität. Einige fortschrittliche Dateisysteme, wie etwa ZFS von Sun, wurden speziell entwickelt, um Daten über mehrere Speicher hinweg zu verwalten. ZFS als Software-RAID unterstützt unterschiedlichste RAID-Level und auch exotische Kombinationen davon. In Bezug auf Flash-Speicher und deren Fähigkeit I/Os zu beschleunigen, können Dateisysteme SSDs entweder als hierarchische Ebene nutzen oder auch als Cache.
Richtig interessant in puncto Flash-Speicher wird es allerdings erst auf der Hardwareebene: RAID-Controller unterstützen das Betriebssystem, indem sie das RAID-System als Laufwerk zusammenfassen. Außerdem ist auf RAID-Controllern ein Read-/Write-Cache angesiedelt, der die Leistung des Systems weiter verbessert. Einzelne Vorgänge sind somit nicht mehr volatil, und - sofern der Cache mit einem Backup-Mechanismus gesichert ist - gehen unerledigte Schreibvorgänge auch nach einem Stromausfall nicht verloren. Hardware-RAID fügt dem Host-Computer keine zusätzliche Belastung zu und bietet eine gleichbleibend hohe Leistung. Bei der Wahl von RAID-Controllern muss der Anwender jedoch darauf achten, dass Modelle unterschiedlicher Hersteller ihre Daten verschieden anordnen und es daher unmöglich sein kann, Controller mehrerer Hersteller im selben RAID zu nutzen.
Flash-Speicher in Tiered Storage Arrays zum Einsatz zu bringen, stellt allerdings nur eine der Möglichkeiten dar, diesen effizient zu nutzen. Neueste Ansätze kombinieren die Flash-Technik stattdessen auf dem RAID-Controller mit intelligenter Caching- und Management-Software und dem Übertragungsweg PCIe. Diese Kombination vermeidet, dass die Daten erst über das langsamere Netzwerk zu SSDs oder Festplatten laufen müssen. Es ist durchaus üblich, dass sich die Leistung von Applikationen dadurch um das Sechsfache steigert, in einigen Anwendungsfällen zeigen Messungen sogar eine dreißigfache Steigerung gegenüber konventioneller Architektur. Über 4 GByte ununterbrochener Datendurchsatz pro Sekunde lässt sich damit erreichen - je nach Speicherumfeld und genutzter Applikation.

Beschleunigung von Primärspeicher, SAN und DAS
Flash-basierendes RAID eignet sich für zahlreiche unterschiedliche Anforderungen. PCIe-Flash-Lösungen mit hoher Kapazität kommen idealerweise bei Primärspeicher zum Einsatz, etwa bei Datenbanken. Eine gute Balance zwischen Kosten und Nutzen bieten Lösungen mit mittlerer Kapazität und nahtloser Caching- und Beschleunigungssoftware, die am besten in hochwertigen SAN- (Storage Area Network) und komplexen DAS-Umgebungen (Direct Attached Storage) zur Geltung kommen. Aber auch einfache DAS-Lösungen lassen sich mit kleineren Flash-Lösungen inklusive Software für Caching und Datenbeschleunigung nutzen und ermöglichen vielen Unternehmen, ihre Zugriffszeiten damit zu verbessern. Zu den weiteren positiven Aspekten solcher Lösungen gehört, dass die Beschleunigung der Applikationen minimale Auswirkungen auf die bestehende IT-Infrastruktur hat und dass Einsparungen bei Energie, Kühlung und Größe die Gesamtbetriebskosten senken.
Um die Herausforderungen der Datenflut zu meistern lässt sich Flash-Technik also schon heute in einem RAID-Umfeld Gewinn bringend einsetzen. Als Tiered-Storage-Anordnung in Verbindung mit existierendem Speicher kann sie unzählige rotierende Festplatten einsparen. Diese wären sonst nötig, um hohe I/Os auf dem bisher üblichen Weg zu gewährleisten. Dem Grundgedanken von RAID - "Redundant Array of Inexpensive Disks" - wurde die bisherige Technik nicht mehr gerecht: Wenn Festplatten nur noch für höhere Performance angeschafft werden und nicht wegen ihrer zusätzlichen Speicherkapazität, dann ist der Preis dafür sehr hoch. Der Ansatz, PCIe-Flash-Technik mit Caching-Software zu verbinden, stellt RAID wieder vom Kopf auf die Füße. Denn das Anliegen derjenigen, die das Konzept entwickelten, war I/O-Leistungssteigerung.

Intelligente Caching-Software wie Nytro XD von LSI kann im Enterprise-Segment Anwendungen massiv beschleunigen: bis zu 600 Prozent mehr I/Os und bis zu 1/47 der Latenzzeit.

Flash-basierende RAID-Controller für Anwendungen im DAS-Umfeld gibt es beispielsweise mit NAND-Flash-Kapazitäten zwischen 100 und 800 GByte (hier "Nytro Megaraid"-Controller von LSI).

Zugriffszeiten in der Speicherhierarchie: Der Zugriff auf Tiered Storage ist üblicherweise bis zu 100.000-mal langsamer als der auf den Hauptspeicher. Flash auf dem RAID-Controller hingegen rückt den Speicher deutlich näher an den Prozessor.
LANline.

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Samsung Techwin

Weitere Artikel zu Guntermann & Drunck GmbH

Matchmaker+