Object Storage verspricht, große Mengen unstrukturierter Daten in einer flachen Hierarchie optimal verwalten zu können. Hybride Cloud-Speicher sind dabei ein gefragtes Anwendungsszenario, das mehrere Marktneulinge bedienen wollen. Die Startups können mit cleveren Umsetzungen punkten.

Objektbasierende Speicherlösungen sollen die Probleme beseitigen, die entstehen, wenn große, unstrukturierte Datenmengen in hierarchischen Storage-Architekturen mit Dateisystemen zu verwalten sind. Diese häufig sehr großen File-Systeme mit tiefen verzweigten Hierarchien sind schwerfällig, wenn es darum geht, aus einem Set von Milliarden Dateien auf genau eine zuzugreifen. Diese Art von Speicherarchitektur eignet sich besser für die Verwaltung von Transaktionsdaten, während Object Storage für unstrukturierte Web- oder Multimediadaten, Big Data, Archive oder Backups die bessere Wahl ist.
Object Storage-Implementierungen speichern Daten als Objekte in einem flachen Adressraum ohne Unterverzeichnisse. Die Objekte umfassen neben den eigentlichen Daten auch deren Metadaten und einen eindeutigen Identifier, anhand dessen ein Zugriff erfolgen kann.
Objektspeicherlösungen gibt es von den Großen, unter anderen von IBM, EMC, Hitachi, HP, Netapp, aber auch von Spezialanbietern etwa aus dem Bereich von Cloud-Speichern, die für ihre Lösungen auf Standard-Hardware setzen. IDCs Market Scape für 2014 bewertet einige dieser Spezialisten wie Scality, Cloudian, Cleversafe oder Amplidata als Marktführer.
Einer der neueren Anbieter ist Cloudian mit einer mehrklientenfähigen Lösung, die für hybride Clouds geeignet ist. Der Anbieter wirbt für seinen Hyperstore-Objektspeicher unter anderem mit der Tatsache, dass die Lösung auf Intel-Servern mit Linux läuft und daher entsprechend kostengünstig sei: Einen Cent pro GByte und Monat gibt Cloudian als Preis an.
Zudem könne die Lösung über Datencenter hinweg praktisch „ohne Obergrenze“ skalieren. Dies liege an der Architektur, so der Marketingchef Paul Turner. Die Lösung besteht aus einem Storage-Pool aus einzelnen Knoten mit jeweils CPU und Laufwerk, die in einer logischen „Ring“-Architektur angeordnet sind. Beim Hinzufügen von physischen Knoten fasst Hyperstore alle Ressourcen im Ring in einem gemeinsamen Speicher- und CPU-Pool zusammen.
 
Verteiltes NoSQL-System
Außerdem setzt der Anbieter auf Apache Cassandra als Repository für Metadaten und Indizes. Dies ist ein verteiltes NoSQL-Datenbankverwaltungssystem, das auf hohe lineare Skalierbarkeit und niedrige Latenz ausgelegt ist. Unternehmensangaben zufolge kann das Datenbankverwaltungssystem die Indizes auf Hunderte Knoten verteilen. Hadoop-Analytics soll innerhalb der Objekte eine schnelle Suche und Analyse der Daten ermöglichen.
Redundanz erreicht der Anbieter wie üblich bei Objekt-Storage über das so genannte Erasure Coding anstatt über das traditionelle RAID-Verfahren. Dieses Verfahren teilt die Daten in Fragmente auf, erweitert und codiert sie mit redundanten Datenteilen und speichert diese verteilt auf mehreren Knoten. Für die Rekonstruktion beschädigter Dateien können diese Informationen ebenfalls zum Einsatz kommen. Auf diese Weise lässt sich Overhead und damit Zeit bei der Datenrekonstruktion sparen.
 
Anbindung an Amazon S3
Hyperstore bietet laut eigenen Aussagen als einziger Hersteller ein komplette S3-Schnittstelle, sodass Anwender damit eigene S3-Clouds bauen können. Zudem können die Daten aus dem Objektspeicher in Amazon S3 oder damit kompatible Clouds geschoben werden (Tiering). Cloudian rechnet sich damit erhebliche Wettbewerbsvorteile aus, denn es gibt mehr als 400 Anwendungen, die S3 nutzen können.
In der eben vorgestellten Version Hyperstore 5.2 kann das Tiering über Richtlinien (Smart Data Policies) erfolgen, die jeder Anwendung beiliegen. Mit der neuen Version hat Cloudian zudem die neue Appliance-Serie Forever live vorgestellt. Die F3000-Appliance liefert bis zu acht Knoten in drei Racks, wobei jedes einen Xeon-Prozessor, 128 GByte Memory und zwei SSDs für Metadatenoptimierung und das Betriebssystem mitbringt. Alle Komponenten sind im laufenden Betrieb austauschbar. Anwender können mit drei Server-Blades und 90 TByte starten und auf bis zu 380 TByte aufrüsten.
Scality, von IDC als Marktführer ausgemacht, konzentriert sich vor allem auf Umgebungen mit Datenvolumen im Petabyte-Bereich, die über Commodity-Hardware Kosten sparen wollen. Auch dieser Hersteller setzt auf eine Ringarchitektur und Erasure Coding sowie den Ersatz von Server-Nodes ohne Unterbrechung des Betriebs. Zudem gibt es einen Zugriff auf VM-Storage.
Die Newcomer spielen also folglich heute eine wichtige Rolle. Anders als die etablierten Speicheranbieter, die breiter aufgestellt sind, konzentrieren sich die Neulinge im Objektspeicher-Markt auf bestimmte Anwendungsszenarien wie Archivierung oder Managed Service Provider, so die Einschätzung von IDC.

Info: CloudianWeb: www.cloudian.com

Die mehrschichtige Ringarchitektur verteilt Object Storage über viele Server-Nodes und nutzt Erasure Coding für den Schutz der Datenintegrität. Bild: Scality

Aufbau des Objektspeichers von Cloudian: Die Lösung besteht aus einem Storage-Pool aus einzelnen Knoten mit jeweils CPU und Laufwerk, die in einer logischen „Ring“-Architektur angeordnet sind.