Netzwerkadministratoren müssen heute auf Dutzende oder Hunderte von Parametern reagieren, die Änderungen im Netz-werk und den Status der Netzwerkinfrastruktur beschreiben. Um schnell Überblick zu gewinnen und sich auf das Wesentliche konzentrieren zu können, ist daher eine intelligente grafische Aufbereitung und Darstellung der komplexen Monitoring-Informationen von großer Bedeutung.Das Sammeln und Speichern großer Mengen an Monitoring-Daten stellt heute keine großen Herausforderungen mehr dar: Arbeitsspeicher, Prozessorgeschwindigkeiten und selbst Bandbreitenanforderungen verursachen kaum noch nennenswerte Kosten. Monitoring-Systeme, die als Virtual Appliance laufen, ermöglichen es beispielsweise, Hunderttausende Leistungsparameter auf einer einzigen virtuellen Maschine mit lediglich 4 GByte RAM und einem Vierkernprozessor zu sammeln. Die Netzwerküberwachung wird somit schon in kleinen Netzwerken mit zirka 50 bis 100 Knoten rentabel. Wie das „Big Data“-Phänomen zeigt, kommt es heute vor allem auf die Fähigkeit an, diese Daten schnell zu analysieren und zu priorisieren sowie daraus Metriken und Statuswerte zu generieren, die den Verantwortlichen konkrete Entscheidungen und Maßnahmen ermöglichen. Wie also sehen die Erwartungen an eine moderne Netzwerk-Monitoring-Software aus?
 
Probleme aufzeigen, Ursachen benennen
Für IT-Administratoren ist es in der Regel nicht relevant, zu erfahren, was alles im Detail irgendwann falsch gelaufen ist – solche Informationen lassen sich in routinemäßigen Berichten sammeln. Wenn der Administrator am Morgen zur Arbeit kommt, will er jedoch wissen, was aktuell nicht funktioniert: Knoten, die nicht verfügbar sind, Services die nicht antworten, überschrittene Grenzwerte oder Alarme zu Problemen, die noch nicht gelöst sind. Eine Monitoring-Software sollte daher in der Lage sein, solche kritischen Phänomene zu sortieren und dem Verantwortlichen die aktuellsten Probleme und Warnungen zuerst anzeigen.
Leistungsmetriken sind dabei zwar grundsätzlich hilfreich, doch erst durch den Vergleich solcher Metriken stellen diese einen Mehrwert dar, den die Rohdaten nicht bieten können. Eine solche Analyse sollte nicht manuell erfolgen müssen, sondern es ist Aufgabe der Software, diese Informationen aufzubereiten und dem IT-Administrator auf einen Blick klare optische Signale – etwa durch unterschiedliche Farben – zu geben. „Out of the box“-Top-Charts wiederum helfen, dieselben Paramter auf verschiedenen Geräten miteinander zu vergleichen. So wird schnell klar, welcher Server beispielsweise zu wenig freien Arbeitsspeicher hat, welches Gerät zu langsam antwortet oder welcher Switch im Vergleich zu anderen überlastet ist.
Was eine allumfassende Gesamtübersicht des Netzwerkstatus kompliziert macht, ist die Tatsache, dass heute die IT-Infrastruktur selbst kleiner und mittelgroßer Unternehmen aus mehr als nur Computern, Switches und Druckern besteht. Anwendungen, Services und entfernte Dienste sind ebenfalls zu verwalten und zu überwachen. Zunehmend sind auch ganz andere Geräte wie Klimaanlagen, Telefone, Überwachungskameras, Sicherheitssysteme, Sensoren, Gebäudesteuerung und vieles mehr in die IT eingebunden.
 
Alles gemeinsam überwachen
Netzwerkadministratoren müssen sich daher häufig auch um diese technischen Ausrüstungen kümmern, oder zumindest berichten, wenn dort Probleme erkennbar sind. Eine Netzwerk-Monitoring-Lösung sollte daher alles in ein und demselben System überwachen zu können. Entsprechendes gilt auch für benutzerspezifische Anwendungen, Produktionsprozesse oder sogar sehr komplexe, über die Zeit gewachsene Installationen, die ein Tool benötigen, das alle damit verbundenen Faktoren gemeinsam überwachen kann. Darüber hinaus sollte ein Monitoring-System auch externe Daten aus verschiedensten Quellen wie Dateien, Web-Seiten, Datenbanken, Skripten oder REST-APIs lesen und verarbeiten können.
Netzwerk-Leistungsmetriken lassen sich heute in sinnvoller Weise animiert auf einem Bildschirm mit wechselnden Ansichten oder verteilt auf mehrere Bildschirme präsentieren. Noch vor zehn Jahren waren die Kosten für solche Lösungen fast unerschwinglich, inzwischen liegt der Preis in einer Größenordnung, die für viele Unternehmen bezahlbar ist. Eine solche Echtzeitübersicht über die komplexen Aspekte der Netzwerkleistung lässt sich dann im hauseigenen „Network Operations Center“ für alle Administratoren übersichtlich präsentieren. Auf diese Weise können die Verantwortlichen ihren Morgenkaffee in Ruhe genießen und dennoch alles im Blick behalten.
Um unterschiedlichem Informationsbedarf gerecht zu werden, lassen sich Leistungsmetriken und Statusdaten automatisch in verschieden Ansichten und in Hierarchiestruktur darstellen. Für Detailinformationen bei der Suche nach der Ursache eines Problems können Netzwerkadministratoren dieses von der Gesamtansicht über Port Mapping zurückverfolgen. Auf diese Weise lassen sich das Gerät, sein physischer Standort sowie der betroffene Port lokalisieren.
 
Priorisierung in der To-do-Liste
Ein klarer Überblick über die aktuelle Situation hilft dem Administrator, einen präzisen Plan zu entwerfen, was zu erledigen ist und in welcher Reihenfolge. Dafür sollte die Monitoring-Lösung Probleme selbst identifizieren und optisch klassifizieren können – etwa mit den Farben Rot für „kritisch“ und Gelb für „Warnung“. Ein gutes System löst häufig auftretende Probleme sogar selbstständig. Es kann aus der Ferne Korrekturen im Netzwerk durchführen – wie etwa Neustart eines Services oder Ausführung eines Programms beziehungsweise Skripts. Wenn die Software solche Probleme automatisch löst, kann sich der Administrator komplett auf kritische oder unvorhergesehene Probleme konzentrieren, die seine ungeteilte Aufmerksamkeit benötigen.
Entsprechend wichtig ist es, dass ein System die aktuell bestehenden Probleme und die noch nicht bearbeiteten Alarmmeldungen signalisiert. Um diese rasch bearbeiten zu können, sollte sich eine Beschreibung an die passenden Mitarbeiter im Unternehmen oder an einen Hersteller-Service zur Problemverifikation weiterleiten lassen. Dafür darf kein langes Suchen in Logdateien notwendig sein. Wichtig sind letztlich präzise Informationen und keine Alarmflut oder die Überhäufung mit Daten. Wenn ein Monitoring-System einerseits Tausende Metriken sammelt, dann muss es andererseits auch in der Lage sein, die Alarme zu filtern. So gilt es beispielsweise, Alarme auf der Basis der Überwachungsabhängigkeiten automatisch zu schließen, wenn Probleme gelöst sind, um Überflüssiges auszublenden.
Mit einem solchen „Smart Monitoring“ lässt sich der tatsächliche Netzwerkstatus übersichtlich und für den Anwender unkompliziert präsentieren. Dazu sollte das Monitoring-Programm automatisch verschiedene Ansichten, Karten und Rollen erstellen können, zudem aber flexibel genug sein, um auch individuelle Ansichten für spezielle Prozesse, Services und Metriken generieren zu können, die sich an die jeweiligen Bedürfnisse anpassen lassen. Gefordert ist auf jeden Fall die klare Darstellung relevanter Werte auf eine Art und Weise, die hilft, schnell eine Diagnose zu erstellen.
 
Vorhersagen
Das Speichern von Leistungsdaten über längere Zeit erlaubt eine Trendanalyse und die Erkennung von Anomalien. Auf diese Weise lassen sich zukünftige Probleme vorhersagen und verhindern, bevor sie einen negativen Einfluss auf das Netzwerk haben. Dazu können IT-Administratoren Monitoring-Regeln anpassen und optimieren – für bestimmte Situationen im Netzwerk lassen sich Alarme beispielsweise sensibler oder gröber einstellen. Auch ist es möglich, Ereignisse, die in Beziehung stehen, gemeinsam zu überwachen, oder weitere Bedingungen für Alarmeinstellungen hinzuzufügen.
Zudem kann die Überwachung desselben Gerätetyps oder der gleichen Applikationen, die identische Regeln verwenden, den Administrator unterstützen, untypisches Verhalten wie Konfigurationsfehler oder sogar Hardwarestörungen festzustellen. Trendanalysen helfen auch bei der Planung von Netzwerkkapazitäten und können langfristig IT-Budgets rechtfertigen. Kurzfristig betrachtet unterstützten sie Anpassungen und Optimierungen aller IT-Strukturen.

Ein Dashboard, wie es etwa die Monitoring-Lösung Netcrunch von Adrem Software bietet, präsentiert dem Administrator die aktuellsten Problembereiche auf einen Blick.

Top Charts vergleichen dieselben Parameter auf verschiedenen Geräten miteinander und bieten der Administration eine Übersicht der Höchstwerte aller kritischen Parameter.

Eine Echtzeitübersicht über die komplexen Aspekte der Netzwerkleistung lässt sich im Network Operations Center für alle Administratoren übersichtlich auf mehreren Monitoren präsentieren.

LANline.