Das Kölner Softwarehaus Gridscale liefert mit Gridscale.io die Technologiebasis für den vollautomatisierten Betrieb von virtualisierten und containerbasierten Umgebungen bei Systemhäusern, Service-Providern sowie neuerdings auch zur lokalen Installation im Unternehmens-RZ. Mittels Automation inklusive Echtzeit-Provisionierung und statistischer Auswertung der Performance-Werte ermöglicht Gridscale dadurch laut eigenem Bekunden eine praktisch 100-prozentige Verfügbarkeit der IT-Infrastruktur.

Gridscale versteht sich als Softwarelieferant für den modernen Cloud-Betrieb, bei dem sich die Intrastruktur mittels Echtzeit-Provisioning, Autoskalierung und intelligent errechneter Kapazitätsprognosen stabil betreiben sowie sehr schnell hoch- und herunterskalieren lässt.

Die Software kann man dabei im Unternehmens-RZ installieren oder aber gehostet von Gridscale beziehen. Dabei, so Henrik Hasenkamp, Mitgründer und CEO von Gridscale, gegenüber LANline, spiele man den Software-Stack auf und übernehme dann den Betrieb inklusive aller operativen Prozesse und des Kapazitäts-Managements.

Im Jahr 2014, so berichtet Hasenkamp, habe man bei Gridscale beschlossen, ein hochverfügbares dezentralisiertes System zu entwickeln, um Unternehmen den autonomen IaaS/PaaS-Betrieb (Infrastructure/Platform as a Service) ohne operative Probleme zu ermöglichen. Denn diesen Anspruch habe der Markt damals trotz zahlreicher Cloud-Softwareanbieter nicht erfüllt.

Deshalb, so Hasenkamp weiter, habe man Algorithmen zusammengestellt, um den RZ-Betrieb als dezentralisiertes System ohne Personal abzuwickeln, Anomalien zu identifizieren und darauf mit einem Maßnahmenkatalog zu reagieren. Die Gridscale-Technik überwache dabei alle relevanten Metriken der Cloud-Umgebung – zum Beispiel die CPU-Zeiten, die eine Datenbank konsumiert – und reagiere bei Auffälligkeiten automatisch.

Ein Beispiel: Gibt es nach einer CPU-Lastspitze keine I/O-Aktivität mehr, wertet das System dies laut dem Gridscale-Chef als Hinweis auf eine Kernel Panic. Sie lade dann automatisch die komplette Workload neu. Bei Störungen rette man die Kundendaten per Live-Migration auf ein anderes Speichermedium. Dieser Hochverfügbarkeitsgedanke mittels automatisierter Betriebs- und Failover-Prozesse zieht sich laut Hasenkamp durch den kompletten Betrieb der Infrastruktur.

Ein Dashboard gibt, wie branchenüblich, den Überblick über den Zustand der Cloud-Umgebung. Bild: Gridscale

Ein Dashboard gibt, wie branchenüblich, den Überblick über den Zustand der Cloud-Umgebung. Bild: Gridscale

Für höchstmögliche Performance nutze Gridscale ein Profiling der Workloads, das man mittels einer Klassifizierungsalgorithmik und statistischen Verfahren dynamisiert habe: Gridscale nutzt laut Hasenkamp „statistische Methoden“ – Marketiers der Branche würden hier sagen: Machine Learning – mit dem Ziel, Anomalien als sich abzeichnende Störungen zu erkennen. Aus den Telemetriedaten wie CPU-Auslastung, I/O-Verhalten etc. errechne die Software eine Prognose für das Workload-Verhalten und reagiere bei einem Soll/Ist-Delta sofort. Dadurch ist es laut Hasenkamp möglich, tausende Rechenzentren „weitgehend autonom“ zu betreiben.

Für den Containerbetrieb bietet Gridscale ergänzend automatisiertes Kubernetes als Plattform-Service. Die Orchestrierung mit Kubernetes eignet sich laut Hasenkamp für fast alle Containerszenarien, doch die Services für Logging, Authentifizierung etc. seien „nicht so toll“. Diese Probleme löse man durch Integration, zum Beispiel mittels Zertifikaten für einzelne Services und Absicherung der APIs. Dies befindet sich aber derzeit noch in der Closed-Beta-Phase.

Gridscale ermöglicht eine automatische Skalierung, im Bild einer MySQL-Instanz. Bild: Gridscale

Gridscale ermöglicht eine automatische Skalierung, im Bild einer MySQL-Instanz. Bild: Gridscale

Das Hosting der Lösung betreibt Gridscale aus zwei georedundanten Rechenzentren von E-Shelter und InterXion. Die Infrastruktur nutzt laut Hasenkamp Standard-19-Zoll-Rack-Server mit einem 10/40G-Netzwerk sowie redundanter Stromversorgung und Connectivity. Da das System dezentralisiert läuft, erfolge die Storage-Nutzung aus den Compute Nodes heraus. Bei größeren Umgebungen (ab 50 Systemen) könne man aber auch separate Storage-Knoten heranziehen. Gridscale.io unterstütze Virtualisierung und Container sowie deren Mischbetrieb. Man stelle zwei Referenzdesigns bereit, die möglichst herstellerneutral gehalten sind.

Der Anbieter gibt laut Hasenkamp ein SLA von stolzen 100 Prozent auf die Verfügbarkeit der Primär-Services, 99 Prozent bei den Sekundär-Services. Bei jedem Verstoß gebe es eine Rückerstattung. In den eigenen RZs habe man bislang tatsächlich hundertprozentige Verfügbarkeit erzielt. Dank der verteilten Architektur gebe es aber selbst bei dem Komplettausfall einer Zone keine Verluste an Workloads oder Daten, betont der Gridscale-CEO.

Die Kölner liefern die Technik vorrangig an große Provider und Systemhäuser, darunter laut Hasenkamp die Komsa-Gruppe und Controlware. Beim Whitelabel-Bezug aus einem Gridscale-RZ lizenziere man nach Verbrauch (Pay per Use), beim Bezug aus einem Partner-RZ nach verwaltetem RAM. Auch ein Mix der Modelle ist dabei laut Hasenkamp möglich, zum Beispiel Betrieb beim Partner und Backup bei Gridscale.

Weitere Informationen finden sich unter www.gridscale.io.

Dr. Wilhelm Greiner ist freier Mitarbeiter der LANline.