Bei Anwendungsfällen, bei denen es um große Datenmengen geht, aber nicht auf die Performance ankommt, empfehlen Hersteller den Einsatz von HDDs. Im umgekehrten Fall sollten hingegen SSDs die erste Wahl sein. Im Rechenzentrum lässt sich diese Empfehlung technisch jedoch nicht so einfach halten.

Eine gängige Auffassung ist, dass man HDDs nur für die Speicherung von großen Datenmengen bei niedrigen Kosten pro Kapazitätseinheit nutzen sollte und SSDs für Applikationen, bei denen es auf eine hohe Performance ankommt. Diese allgemeine Empfehlung ist jedoch nur bedingt richtig. Eine nähere technische Betrachtung zeigt, dass vor allem auch die Blockgröße der Daten für die HDD- und SSD-Performance entscheidend ist.

Eine einzelne Festplatte ist langsam, viel langsamer als eine einzelne SSD. Daher setzen sich SSDs in Anwendungen, bei denen der IT-Verantwortliche eine oder wenige Komponenten einsetzt, mehr und mehr durch. Zu nennen sind etwa Laptops und Desktop-PCs, Boot-Laufwerke in Servern oder lokale Speicher für Datenbanken. Allerdings kostet SSD-Speicher pro Kapazitätseinheit ein Vielfaches im Vergleich zu einer Festplatte. Für die genannten Applikationen lässt sich der Aufpreis akzeptieren, da typischerweise die Anforderungen an die Gesamtspeicherkapazität eher gering sind.

Tabelle 1. Die Konfiguration zeigt: Bei fast gleichem Anschaffungspreis bietet die HDD-Konfiguration eine fast dreimal höhere Nettokapazität als die SSD-Architektur. Tabelle: Toshiba

Im Rechenzentrum hingegen müssen Betreiber in erster Linie große Datenmengen zu günstigen Anschaffungs- und Betriebskosten speichern. Daher bauen sie hier naturgemäß größere Speicherarchitekturen aus vielen einzelnen Komponenten auf. Unter der Verwendung eines RAID-Systems müssen die Verantwortlichen bei Applikationen mit hohen Anforderungen an die Datenspeicherkapazität mehrere SSDs und HDDs zusammenführen. Außerdem stehen auch neue SDS-Systeme (Software-Defined Storage) zur Verfügung, die kostengünstige, aber vergleichsweise langsame HDD-Komponenten zu High-Speed-Systemen zusammenfassen können.

Im Hinblick auf Rechenzentren stellt sich die Frage, ob der Einsatz eines Arrays mit vielen Enterprise-HDDs zweckmäßiger ist als eine Konfiguration mit wenigen Enterprise-SSDs – und zwar hinsichtlich der Kosten pro Kapazitätseinheit und der Performance. Und diese Frage ist in vielen Fällen durchaus mit „ja“ zu beantworten, wie ein Test zeigt.

Tabelle 2. Die SSD-Lösung liefert insgesamt die bessere Performance ab. Tabelle: Toshiba

Der Testaufbau der SSDs besteht aus acht 1,6 TByte großen 3DWPD-SATA-Enterprise-SSDs in einer RAID6-Konfiguration mit doppelter Parität für die Datensicherheit. Gesteuert von einem internen RAID-Controller haben die Administratoren die SSDs innerhalb der Testumgebung in der Frontplane des Referenz-Servers installiert.
Für die Gegenüberstellung wird eine HDD-Konfiguration mit 24 HDDs mit einer Speicherkapazität von bis zu 2,4 TByte verwendet. Diese Lösung entspricht dem Preis einer Konfiguration mit acht SSDs. Sie ist in einem 24-Bay-JBOD mit 2 HE installiert und mit einem zweiten RAID-Controller im Evaluierungs-Server verbunden. Die HDDs sind als RAID10 konfiguriert, also als Kombination von RAID0 Striping mit parallel genutzten Laufwerken zur Performance-Aggregation und RAID1-Spiegelung für die Datensicherheit. Einen Überblick über die Testkonfiguration liefert Tabelle 1.

Die Performance-Evaluierung

Die Evaluation der beiden Lösungen erfolgt mit Hilfe von Fio-Skripten durch die Generierung von synthetischen Random-Workloads mit 16 simultanen Lese- und Schreibaufgaben.

Der Test zeigt ein zu erwartendes Ergebnis: Die SSD-Lösung liefert insgesamt die bessere Performance ab, da bei kleinen Blockgrößen und einem hohen Anteil an Datensuchprozessen die Geschwindigkeit durch die IOPS dominiert wird (siehe dazu auch die Daten in Tabelle 2).

Jedoch verändert sich das Ergebnis bei zunehmender Blockgröße: Bereits ab 64 kB bieten 24 parallel genutzte HDDs eine höhere Performance, wie in Tabelle 3 zu sehen ist.

Damit schneidet die SSD-Lösung bei kleineren Blockgrößen zwischen 4 kB und 32 kB besser ab. Dieser Workload fällt in der Regel bei Applikationen wie Finanztransaktionen, Datenbanken oder hochperformanter Analytik an. Diese Applikationen benötigen in der Regel eine Speicherkapazität von wenigen TByte. Damit sind die Kosten der SSD-Technologie durch die höhere Performance gerechtfertigt.

Tabelle 3. Ab einer Blockgröße von bereits 64 kByte bieten 24 parallel genutzte HDDs jedoch eine höhere Performance. Tabelle: Toshiba

HDDs sind ab 64 kB schneller

Dahingegen erweist sich die Multi-Spindel-Lösung mit 24 parallelen HDDs bei Workloads mit höherer Blockgröße von über 64 kB als schneller als die SSD-Variante. Applikationen, die in diese Kategorie fallen, findet man in Bereichen wie Cloud-Storage, Web- und E-Mail-Hosting, Dokumenten-Management oder Backup und Archivierung. In der Realität setzen sich die Workloads meist aus einem Mix von kleineren und größeren Blöcken und Dateien zusammen.

Insgesamt zeigen die Tests, dass die HDD-Lösung eine höhere Performance bei vielen tatsächlichen Workloads bieten kann. Reine HDD-Konfigurationen sind in vielen Fällen deshalb speziell im RZ immer noch sinnvoll – und dies wird sich wohl auch in naher Zukunft nicht ändern. 

Rainer W. Käse ist Senior Manager Business Development, Storage Products bei Toshiba Electronics Europe, www.toshiba-storage.com.