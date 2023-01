Software für die Cloud ist sinnvollerweise in Containern organisiert. Für das Management dieser verteilten Systeme wurde das Open-Source-Projekt Kubernetes ins Leben gerufen, das eine automatische Zuweisung (Orchestrierung) von Services unterstützt. Daraus ergibt sich aber ein neues Problem: Die Ursachen für etwaige Fehlfunktionen lassen sich nur schwer ermitteln. Die Lösung heißt Kubernetes-Monitoring mit zentraler Alarmfunktion.

Ohne die Open-Source-Software (OSS) Kubernetes wäre es kaum möglich, containerisierte Anwendungen zu entwickeln und bereitzustellen, geschweige denn den Überblick über geänderte Zuweisungen zu behalten. Ob die Orchestrierung korrekt funktioniert, merken Anwender meist sofort: Wenn es wieder einmal länger dauert, bis ihre Applikation das tut, wofür sie geschaffen wurde, liegt das manchmal am Netz, häufiger aber daran, dass die verteilten Micro-Services nicht sauber interagieren.

Die Management-Funktion in Kubernetes (K8s Master) ist dafür ausgelegt, Pods, Nodes und Container zu steuern, ihnen Aufgaben und die Ressourcen zuzuweisen sowie periphere Dienste wie API-Server, Key Value Store und Scheduler zu managen. Diese Funktionen kann er aber nur erfüllen, wenn jeder Service für sich sowie die Integration und Kommunikation auf den unterschiedlichen Ebenen der Kubernetes-Architektur reibungslos läuft. Ist das nicht der Fall, gerät Sand ins Getriebe. Dann stellt sich die Frage: Woran genau liegt es?

Monitoring statt Blackbox

Erst wenn ein Problem bekannt ist, lässt es sich beheben. Es gilt also herauszufinden, welcher Dienst exakt betroffen ist. Kubernetes ist keineswegs eine Blackbox, aber in einem komplexen und verteilten System ist die Frage nach der Ursache eines Problems trotzdem schwer zu beantworten. Administrationsteams verlieren hier früher oder später den Überblick. Deshalb benötigen sie ein leistungsfähiges Monitoring-Werkzeug.

Im Kubernetes-Umfeld hat sich erwartungsgemäß eine ganze Reihe von Open-Source-Tools herausgebildet, die unterschiedliche Monitoring-Bereiche abdecken. Sie überwachen Log-Daten, stellen Tracing-Funktionen bereit und stülpen Metriken über die Service-Prozesse, um die Leistungsfähigkeit der Gesamtanwendung und ihrer einzelnen Teile zu verfolgen.

Standard mit kleinen Schönheitsfehlern

Weit verbreitet und mittlerweile auch schon ein Standard ist das Zeitreihen-Datenbanksystem Prometheus. Es resultiert aus einem Projekt der Cloud Native Computing Foundation (CNCF), das von Grund auf für Kubernetes und damit selbstverständlich als OSS entwickelt wurde.

Prometheus kann Informationen aus allen Ebenen der Kubernetes-Architektur zusammentragen. Das zugrunde liegende Datenmodell lässt mittels einer eigenen Abfragesprache namens PromQL die Auswertung nach unterschiedlichen Dimensionen zu. Der eingebaute Alarmmechanismus warnt das Administrationsteam, sobald die Ist-Daten vom Soll abweichen. Darüber hinaus lässt sich die Monitoring-Software relativ einfach nutzen. Das alles begründet die stetig wachsende Zahl der Anwender.

Allerdings hat Prometheus auch ein paar Schwachstellen. Eine davon ist die Skalierbarkeit. Das Werkzeug eignet sich sehr gut für einzelne Cluster oder begrenzte Umgebungen, kann aber umfangreichere Systeme oft nicht mehr handhaben. Zudem legt die Software Metriken im Dateisystem ab, was eine Speicherung über längere Zeiträume ineffizient macht.

IT-Service-Provider bemängeln darüber hinaus die fehlende Mandantenfähigkeit. Sie benötigen ein System, auf dass sie selbst und auch ihr Kunde zugreifen können. Last but not least ist es mit Prometheus nicht ohne Weiteres möglich, Informationen aus unterschiedlichen Clustern zusammenzuführen. Deshalb lässt sich mit Prometheus allein kein zentraler Alert-Mechanismus einrichten.

