Maps liefern wichtige Informationen im Rechenzentrum.

Rechenzentren sind komplexe Systeme, die auf zahlreichen Subsystemen basieren. Nur wenn alle Systeme funktionieren, kann das Rechenzentrum tun, was es soll – nämlich zuverlässig rund um die Uhr an sieben Tagen die Woche die Basis für die IT eines (oder auch mehrerer) Unternehmen zur Verfügung stellen. Normalerweise sind dazu sogenannte Datacenter-Infrastructure-Management-Tools (DCIM) im Einsatz. Dies sind relativ aufwendige und kostspielige Systeme, die eine Vielzahl von Funktionen anbieten, von Monitoring über Inventarisierung bis hin zu Kapazitätsplanung. Das Unternehmen All IT Rooms plant, baut und betreibt Rechenzentren für diverse Anwenderunternehmen. Um diesen möglichst zuverlässige RZs bieten zu können, ist ein DCIM nötig. Allerdings geht das Unternehmen dabei einen ungewöhnlichen Weg.

Aber erst mal von vorne: Vor einigen Jahren beschloss All IT Rooms, ein DCIM-Tool einzuführen. Ein wesentlicher Aspekt war dabei das Monitoring: Nur wenn sich Probleme in Echtzeit entdecken, melden und beheben lassen, ist ein reibungsloser Betrieb eines Rechenzentrums zu gewährleisten. Bei der Evaluierung erwiesen sich sämtliche DCIM-Lösungen als zu kompliziert, zu langsam und zu unzuverlässig, sobald es um das Thema Monitoring ging. Nachdem All IT Rooms schon länger Paess­ler PRTG als IT-Monitoring-Tool einsetzte, beschloss man, die Lösung ebenfalls in die Evaluierung aufzunehmen. PRTG punktete in Hinsicht auf die Zuverlässigkeit und Geschwindigkeit beim Monitoring. Natürlich reichen Zuverlässigkeit und Geschwindigkeit allein nicht für eine DCIM-Lösung, aber PRTG erfüllte auch die anderen Kriterien, die All IT Rooms für die Evaluierung als Priorität definiert hatte:

1. Mandantenfähigkeit: All IT Rooms betreibt Rechenzentren für mehrere Anwenderunternehmen. Das muss sich über die eingesetzte Software abbilden lassen.

2. Skalierbarkeit: Erweiterte Services, neue Anwenderschaft – nur wenn die eingesetzte Software sowohl bei der Lizenzierung als auch bei der Implementierung entsprechend skaliert, kann sie langfristig eine Option darstellen.

3. Ursachenfindung: Bei Störungen im Rechenzentrum ist es elementar, die Ursache schnellstmöglich zu identifizieren, um sie beheben und so gravierende Folgeschäden vermeiden zu können.

Ebenfalls wichtig für ein frühzeitiges Erkennen und schnelles Reagieren sind übersichtliche Anzeigen. Dabei ist entscheidend, dass sich individuelle Dashboards erstellen lassen, die immer aktuell und zielorientiert die wesentlichen Informationen vermitteln. All IT Rooms löst das mit den sogenannten Maps in PRTG. Per Drag and Drop kann man einfach und unkompliziert HTML-Seiten generieren, die sich dann beispielweise auf Bildschirme an exponierten Stellen im Rechenzentrum projizieren lassen. Auf diesem Weg lässt sich gewährleisten, dass die benötigten Informationen klar verständlich immer da verfügbar sind, wo sie nötig sind. Eine herkömmliche IT-Monitoring-Lösung deckt nicht den kompletten Funktionsumfang einer vollwertigen DCIM-Lösung ab: Asset-Management, Kapazitätsplanung, Umgebungsüberwachung, Sicherheitsaspekte oder die Überwachung des Stromverbrauchs sind wichtige Funktionen für den Betrieb eines Rechenzentrums und nicht unbedingt Standard bei IT-Monitoring-Tools. Große Teile davon lassen sich allerdings auch mit einer Monitoring-Lösung bewältigen, vorausgesetzt, diese liefert einige Extras.

Monitoring statt DCIM?

Die richtige Temperatur spielt im RZ eine wesentliche Rolle. Überhöhte Temperaturen führen zu stärkerem Verschleiß von Hardwarekomponenten bis hin zu Ausfällen durch Überhitzung, zu niedrige Temperaturen weisen auf unnötige Kühlung und auf einen zu hohen Energieverbrauch hin. Zwar liegen die Niederlande nicht gerade in südlichen Regionen, aber auch in Mitteleuropa erreichen die Temperaturen neue Rekordwerte, was die Kühlung von Rechenzentren immer aufwendiger und teurer macht. Im Verbund mit massiv gestiegenen Energiepreisen ist so ein effizientes Temperatur-Management ein unerlässliches Instrument für den wirtschaftlich erfolgreichen Betrieb eines Rechenzentrums. Dazu gehört nicht nur das Messen der Temperaturen inner- und außerhalb von Geräten und Racks, sondern auch das Überwachen von Klimaanlagen oder Türen und Fenstern. Nun lassen sich zwar bei den meisten IT-Geräten die Temperaturen via SNMP abfragen – bei Sensoren für die Umgebungstemperatur funktioniert das aber nicht immer. Viele Komponenten der Gebäudetechnik wie Temperaturfühler, Türschließsensoren oder auch Klimaanlagen unterstützen keine der klassischen IT-Monitoring-Methoden oder -Protokolle. Hier kommen MQTT und Modbus ins Spiel, oder auch die Möglichkeit, Informationen via API abzufragen. PRTG unterstützt all diese Methoden und bietet dazu die Möglichkeit, individuelle Maps anzulegen. Mit Dashboards, auf denen beispielsweise Grundrisse des Rechenzentrums eine genaue Lokalisierung der jeweiligen Geräte und Messwerte ermöglichen, kann man eine Heatmap erstellen, die einen ständigen Überblick über die Temperaturentwicklung im Rechenzentrum bietet.

Überwachung des Batteriestatus

Ein weiterer wichtiger Aspekt beim Betrieb eines Rechenzentrums ist eine kontinuierliche Stromversorgung. Diese lässt sich durch eine USV (Unterbrechungsfreie Stromversorgung) gewährleisten. Das sind normalerweise batteriegestützte Systeme, die zwischen Stromversorgung und Verbraucher positioniert sind. Im Regelbetrieb lassen sich die Batterien laden, um bei Stromausfall oder anderen Störungen kritische IT-Systeme zu versorgen und so Ausfälle zu verhindern. Entscheidend bei einer USV ist das kontinuierliche Überwachen des Batteriezustands. Die Lösung kann dazu ebenfalls im Einsatz sein.

Monitoring als Basis für eine individuelle DCIM-Lösung

Auch was das Thema Sicherheit angeht, kann PRTG punkten: zum einen auf IT-Ebene, indem die Lösung klassische Sicherheitskomponenten wie Backup-Systeme oder Firewalls überwacht, zum anderen bei der Gebäudetechnik, indem sich Türschließsysteme, Rauchmelder oder Sicherheitskameras an PRTG anbinden und in das zentrale Monitoring integrieren lassen. So kann man die komplette Sicherheit sowohl auf IT- als auch auf physikalischer Ebene mit einem System überwachen und auf einer Übersicht abbilden.

PRTG liefert Daten zu allen Aspekten der überwachten All-IT-Rooms-Rechenzentren und speichert sie langfristig. Die Analyse der Daten mit Hilfe selbst entwickelter Tools ermöglicht All IT Rooms Optimierungen auf verschiedenen Ebenen:

Leistungssteigerung und Zuverlässigkeit: Langzeitmessungen liefern die Daten zur Identifizierung von Schwachstellen wie beispielsweise zu hohen Temperaturen, niedrigen Batterieständen oder überlasteten Einzelkomponenten, die sich nachhaltig auf Leistung und Zuverlässigkeit auswirken.

Kostenoptimierung: Zu niedrige Temperaturen sind ein Indikator für übermäßige Kühlung, zu hohe Temperaturen führen zu erhöhtem Verschleiß, was wiederum Schäden und Ausfälle verursachen kann. Monitoring hilft, das Temperatur-Management zu optimieren auf und reduziert den Ressourcenverbrauch. So ist es möglich, Kosten zu sparen und die Umwelt zu schonen.

Bessere Planung: Langfristige Monitoring-Daten bilden die Datengrundlage für eine kontinuierliche Optimierung der bestehenden Rechenzentren und für die effizientere Planung neuer Rechenzentren.

Mit dem DCIM-System auf Basis von PRTG schafft All IT Rooms einen Mehrwert für seine Anwenderschaft. Störungen lassen sich umgehend erkennen und zeitnah beheben, zusätzlich liefert die Lösung langfristige Daten, die wiederum die Grundlage für nachhaltige Optimierungen im RZ darstellen.

Thomas Timmermann ist Senior Market Expert bei Paessler.