Cloud-Ressourcen sind in immer mehr Unternehmen integraler Bestandteil der IT-Infrastruktur und deren Verfügbarkeit ist – auch in Deutschland – immer häufiger ein kritischer Faktor für die Geschäftstätigkeit. Niemand kann sich in diesem Zusammenhang verzögerte Antwortzeiten, unterversorgte Workloads, Ausfallzeiten oder Sicherheitslücken leisten. Für die Hardwaresicherheit ist der Provider zuständig. Doch die Verantwortung für Daten, Anwendungen und Netzwerksicherheit bleibt immer beim Unternehmen.

Die Cloud-Instanzen muss ein Betreiber genauso gut überwachen wie die internen Netzwerkkomponenten und Endgeräte. Cloud-Monitoring hilft, potenzielle Probleme im Voraus zu erkennen und zu eliminieren und unnötige Kosten bei den Cloud-Providern zu vermeiden. Cloud-Monitoring ist der Prozess der Überprüfung und Verwaltung der betrieblichen Abläufe und Prozesse innerhalb einer Cloud-Infrastruktur oder von Cloud-Assets. Das Problem: Die meisten Unternehmen beschränken sich dabei nach wie vor auf die nativen Monitoring-Oberflächen der Cloud-Provider, zum Beispiel Amazon CloudWatch oder Azure Monitor. Dass Unternehmen die Cloud über solche Oberflächen administrieren, statt die APIs der Provider zu nutzen, stammt aus der Zeit, als die Cloud nur für sehr ausgewählte unkritische Zwecke und Pilotprojekte oder im Rahmen der Schatten-IT der Fachabteilungen zum Einsatz kam. Doch die Zeit, in der Cloud-Computing eine Ausnahmeerscheinung war und IT-Abteilungen ihre Cloud-Anwendungen noch an einer Hand abzählen konnten, ist vorbei. Die Monitoring-Oberflächen der Provider bieten die genauesten Informationen über die jeweilige Umgebung. Warum genügen sie dennoch den heutigen Ansprüchen nicht mehr? Die wichtigsten Gründe: Sie bieten nur eingeschränkte Möglichkeiten, Dashboards individuell anzupassen und maximal 90 Tage Historie. Dies ist viel zu wenig, um zum Beispiel im Oktober zu errechnen, wieviel Computing-Ressourcen ein Online-Shop im kommenden Weihnachtsgeschäft benötigt. Dazu braucht man die Daten der Vorjahre. Darüber hinaus sind diese Tools nicht darauf ausgerichtet, festzustellen, ob Nutzung und Kosten innerhalb des Plans sind, ob der Cloud-Provider seine SLAs einhält, ob Daten wirklich innerhalb von Deutschland oder der EU liegen und ob sich möglicherweise Geld sparen lässt, indem das Unternehmen bestimmte ungenutzte Dienste kündigt.

Vor allem aber erhalten Unternehmen auf diese Weise keinen Überblick, sondern müssen ihre verschiedenen IT-Ressourcen wie einzelne Silos verwalten. Der Administrator muss seine Aufmerksamkeit teilen. Auch Wechselwirkungen zwischen Cloud-Umgebungen und physischen Umgebungen lassen sich mit den Monitoring-Tools der Provider nicht kontrollieren – wenn zum Beispiel eine Cloud-basierende Website nicht richtig funktioniert, weil die Abfrage in einer Datenbank im Rechenzentrum scheitert.

Professionelles Cloud-Monitoring erfordert also eine automatisierte Überwachungssoftware, die über Administrations-APIs einen zentralen Zugriff und die Kontrolle über die Cloud-Infrastruktur ermöglicht. Administratoren können dort den Betriebsstatus und den Zustand von Geräten und Komponenten in verschiedenen Clouds überprüfen und sie können langfristige Trends in der Nutzung und Abrechnung verfolgen. Doch wie macht man dies konkret?

Zunächst gilt es, eine effiziente Monitoring-Infrastruktur zu schaffen. Cloud-Monitoring und Netzwerk-Monitoring müssen durch ein Team und ein Tool realisiert sein. Gleichgültig, welche Monitoring-Software ein Betreiber wählt – was Cloud-Monitoring angeht, steht allen exakt das gleiche Datenmaterial zur Verfügung, das sie über die APIs erhalten. Es kommt also darauf an, was sie daraus machen, wie sie es darstellen und nutzen – und darauf, dass nicht ein klassisches Lizenzmodell bei der Anwendung in der Cloud zur Kostenfalle wird.

© Progress Alle Cloud-Instanzen lassen sich in die Network Map integrieren.

Einzelabfragen

Einige Monitoring-Software-Lösungen sind dabei vor allem darauf eingestellt, bei Bedarf Einzelabfragen in Clouds zu ermöglichen. Andere legen Wert darauf, Daten und Zahlen zu aggregieren, um Statistiken oder KPIs immer aktuell darzustellen. Die Gefahr ist jedoch angesichts der heutigen Komplexität bei beiden Ansätzen, den Wald vor lauter Bäumen nicht zu sehen. Die meisten Administratoren, die verteilte Netzwerke und mehrere Cloud-Dienste nutzen, werden daher eine nutzerfreundliche Network Map als Kernelement des gemeinsamen Monitorings von Netzwerk und Cloud ansehen.

Solche Produkte beherrschen ein automatisches Discovery auf Layer 2 und 3 und zeigen die gesamte Infrastruktur im Überblick mittels einer interaktiven Karte dar. Im Netzwerk findet die Monitoring-Software alle Geräte, die ein Ping erreichen kann. Für die Cloud gibt der Administrator einmal seine Anmeldedaten an (bei AWS den Access Key und den Secret Access Key) und hat dann nach wenigen Minuten alle Ressourcen auf seinem interaktiven Netzwerkplan.

© Progress Per Mausklick kann der Administrator tiefer in die Network Map eintauchen.

Azure und AWS

Eine Azure- oder AWS-Infrastruktur bildet auf so einem Plan dann jeweils ein „Portal“. Weitere Linien gehen von diesem Portal als Mittelpunkt dann zum Beispiel zum darauf betriebenen Host und zu den darauf betriebenen virtuellen Maschinen. Auf der Karte lässt sich anhand eines einfachen Farbcodes (grün, orange, rot) sehen, wo ein Gerät Probleme bereitet oder wo der Traffic nicht wie erwartet fließt. Die gesamte Unternehmensumgebung bleibt so im Blick, der Administrator kann sich per Klick auf die Karte einen Überblick über den Zustand jedes Geräts machen.

Dies lässt sich kombinieren mit individuell konfigurierten Alarmen, wenn bestimmte Schwellenwerte unter- oder überschritten werden oder auch mit vordefinierten Routinen. Wenn ein bestimmtes Gerät zwei Minuten lang nicht reagiert, veranlasst die Monitoring-Software einen Neustart. Die Karte ermöglicht darüber hinaus Filter (zum Beispiel nach Gerätetyp oder Gerätestatus) und bietet Overlay-Ansichten, um kabellose Netzwerke, virtuelle Umgebungen, Cloud-Ressourcen, Netzwerk-Abhängigkeiten oder die Nutzung von Interfaces grafisch darzustellen. Die Karte lässt sich darüber hinaus mit einer Weltkarte oder Grafiken kombinieren, um der gesamten IT-Abteilung alle notwendigen Erklärungen zu geben.

Für jede übliche Cloud-Anwendung bietet eine solche Monitoring-Software ein vorgefertigtes Profil mit einer Auswahl an Sensoren. Dies sind dann zum Beispiel neun Sensoren bei einem einfachen Drucker-Server (wie Tintenstand, Queue, Papier) oder 37 Sensoren bei einem komplexeren Asset wie einem Microsoft SQL Server 2019. Diese Sensoren funktionieren auf die gleiche Weise wie bei IT-Ressourcen im eigenen Rechenzentrum.

Typische Funktionen des Cloud-Monitorings sind die Überwachung von Cloud-basierenden Websites, virtuellen Maschinen, Datenbanken, virtuellen Netzwerken und Cloud-Speicher. Hinsichtlich des Website-Monitoring geht es insbesondere um die Verfügbarkeit und Funktionsfähigkeit der Websites und ihrer Quellsysteme. Die Monitoring-Software ruft in regelmäßigen Intervallen bestimmte Inhalte ab und prüft ob sie erreichbar sind. Ebenso schickt sie bestimmte Befehle und prüft, ob diese ausgeführt werden. Wenn Probleme auftauchen, kann der Admin die Prozesse und den Datenverkehr anschauen, um zum Beispiel festzustellen, ob das Problem beim Web-Server, in einer verwendeten Datenbank oder Web-Applikation oder aber im Bereich der Konnektivität liegt. Auch die Ressourcennutzung der Websites lässt sich in Echtzeit betrachten.

1.2. Virtuelle Maschinen