GridGains gleichnamige In-Memory Computing-Plattform ist die kommerzielle Variante der Open-Source-Software Apache Ignite. Sie dient dazu, datenintensiven Anwendungen eine Skalierung bis auf mehrere hundert Millionen Transaktionen pro Sekunde und ein Volumen In-Memory-Daten im PByte-Bereich zu ermöglichen. Jüngst hat der Anbieter mit GridGain Cloud eine „In-Memory Cache as a Service“-Lösung als Betaversion vorgestellt. LANline sprach mit Abe Kleinfeld, CEO von GridGain Systems, über die Software.

GridGains Datenplattform – Basisbestandteile hat GridGain der Apache Foundation unter dem Namen Ignite als Open Source bereitgestellt – kann als In-Memory-Datenbank ebenso zum Einsatz kommen wie als In-Memory Data Grid (also als Umgebung für die geografisch verteilte Datenhaltung). Dank der Lösung laufen Datenverarbeitungsschritte laut GridGain-Chef Abe Kleinfeld 5.000- bis sogar millionenfach schneller ab als beim Einsatz gewöhnlichen Festplattenspeichers.

Die GridGain-Software fügt sich dabei als Cache zwischen die Applikationen und die Datenbank ein, so Kleinfeld. Dadurch seien beim Umstieg auf die Lösung keinerlei Änderungen an der Datenstruktur oder den Anwendungen erforderlich. Als Cloud-Anwendung mit verteilter Architektur skaliere die Lösung auf eine unbegrenzte Zahl handelsüblicher Server.

„Geschwindigkeit und Skalierung sind die wichtigsten Bestandteile jeder digitalen Umgebung“, so Kleinfeld. „Der Bedarf ist in beiderlei Hinsicht während der letzten zehn Jahre erheblich gestiegen, vor allem durch Cloud-, aber auch durch IoT-Anwendungen.“

„Geschwindigkeit und Skalierung sind die wichtigsten Bestandteile jeder digitalen Umgebung“, so GridGain-CEO Abe Kleinfeld. Bild: GridGain Systems

„Geschwindigkeit und Skalierung sind die wichtigsten Bestandteile jeder digitalen Umgebung“, so GridGain-CEO Abe Kleinfeld. Bild: GridGain Systems

Gegenüber SAP HANA, der in Deutschland wohl bekanntesten In-Memory-Computing-Lösung, zeichne sich GridGain durch Flexibilität und Offenheit aus: SAP HANA sei zwar eine „Vorzeigelösung“ für das In-Memory-Computing, sie sei aber proprietär und komme nur als In-Memory-Datenbank für SAPs eigene Anwendungen zum Einsatz. „HANA ist großartig für SAP-Applikationen, GridGain ist großartig für alles andere“, formuliert es Kleinfeld pointiert. Denn GridGain unterstütze als In-Memory-Datenbank oder -Data-Grid Hadoop ebenso wie jegliche SQL-Datenbank. Zudem sei sie dank der Open-Source-Basis nicht proprietär, somit also funktionsreicher und zugleich preiswerter.

Eine derartige Lösung zu entwickeln hat laut Kleinfeld acht bis zehn Jahre gedauert. Die größte Herausforderung habe darin bestanden, dass die Software hochverfügbar und hochskalierbar sein musste, zugleich aber mit zahlreichen Datenbanken und Applikationen zusammenspielen und dabei auf Standardhardware laufen sollte.

Erste Anwender habe man in der Finanzindustrie und der Technologiebranche gefunden. „In der Finanzindustrie ist Geschwindigkeit Geld“, so Kleinfeld, „während es die Technologiebranche mit enormen Skalierungsanforderungen zu tun hat.“ Während Cloud-Größen wie AWS, Google oder Facebook auf eigene Technik setzen, nutzen laut Kleinfeld zum Beispiel die Personal-Management-App Workday oder auch das Identity-Management-System von Azure GridGain-Software, zudem diverse Cloud-Services von Huawei.

Als Referenzkunden hob Kleinfeld die russische Sberbank heraus: Die Russen betreiben GridGain mit 1,5 PBytes an In-Memory-Daten auf der Basis von 2.000 Knoten mit je 768 GByte RAM. Die besondere Herausforderung war hier laut dem GridGain-CEO, dass das SLA für das Wiederanlaufen der Umgebung im Störungsfall mit fünf Minuten eine extrem hohe Messlatte vorgab. Dazu, so Kleinfeld, habe man ein Kernproblem des In-Memory-Computings lösen müssen: dass nach einer Störung alle Daten wieder von Festplatten in den RAM zu laden sind, was bei einem Datenbestand dieser Größenordnung einen ganzen Tag dauern könne.

Dieses Problem habe man durch die Entwicklung einer Memory-zentrischen Architektur gelöst, die mit RAM ebenso wie mit Festplatten oder auch einer Mischung von beidem arbeiten kann. Dadurch, so Kleinfeld, könne GridGain beim Wiederanlaufen von Festplatte neu starten und sei somit nach einem Ausfall sofort wieder einsatzbereit.

Ein Unternehmen könne dabei das Mischungsverhältnis von Festplatten und RAM – und somit den Kostenaufwand – selbst bestimmen. Je mehr RAM die Architektur enthalte, desto schneller laufe die Umgebung eben. Dadurch, so Abe Kleinfeld, überwinde die GridGain-Lösung die Limitierungen des In-Memory-Computings und sei überall einsatzfähig.

Das Dashboard von GridGain gibt Auskunft über die Auslastung der Umgebung. Bild: GridGain Systems

Das Dashboard von GridGain gibt Auskunft über die Auslastung der Umgebung. Bild: GridGain Systems

Die Software könne als selbstständiges „System of Record“ laufen, ebenso aber als Caching Layer mit jeder beliebigen SQL-Datenbank zusammenspielen. Hierbei müsse man nicht einmal für Machine-Learning-Anwendungen bestehende Infrastrukturen verändern, betonte Kleinfeld.

Während die Basissoftware mit Apache Ignite kostenfrei verfügbar ist, beruht GridGains Geschäftsmodell auf ergänzenden kommerziellen Komponenten: für Management und Monitoring, Sicherheit und Auditing, Netzwerk-Segmentierung sowie RZ-Replikation und Hochverfügbarkeit. Das Softwarehaus lizenziert diese Erweiterungen pro Recheneinheit, bestehend aus je vier Prozessoren und 4 GByte RAM.

In Europa vertreibt der US-Anbieter mit Hauptsitz im kalifornischen Foster City die Lösung bislang von Niederlassungen in Frankreich und UK aus. In Kürze wolle man aber auch ein Büro in Deutschland eröffnen, so Abe Kleinfeld.

Weitere Informationen finden sich unter www.gridgain.com.

Dr. Wilhelm Greiner ist freier Mitarbeiter der LANline.