Software-Tools für das Datacenter-Infrastructure-Management (DCIM) kommen in vielen Rechenzentren zum Einsatz und unterstützen einen automatisierten IT-Betrieb. Gerade für kleine und mittlere Unternehmen ist DCIM ein ideales Werkzeug, um die Ausfallsicherheit der IT-Umgebung zu verbessern. DCIM-Lösungen lassen sich schon im kleinen Rahmen realisieren. Dies ist gerade für den Mittelstand interessant, denn dieser benötigt häufig nur einen geringen Funktionsumfang.
In der Praxis fällt es vielen mittelständischen Betrieben aus wirtschaftlichen Gründen schwer, einen eigenen IT-Experten nur für die Überwachung von IT-Systemen einzustellen. Die Lösung sind daher clevere Monitoring-Systeme, die weitgehend automatisiert die Infrastruktur rund um das Rechenzentrum überwachen. Ein solches System sollte Komponenten wie Server-Schränke, Stromversorgung oder Klimatisierung kontinuierlich auf eventuelle Probleme überwachen und das Technikpersonal oder die Gebäudesicherheit frühzeitig informieren.
Ein wichtiger Faktor zur Erhöhung der Ausfallsicherheit ist das Monitoring der kompletten Stromeinspeisung bis hin zum Server. Fällt eine Komponente in der Stromversorgungskette aus, so sind die Server ohne Strom. USV-Systeme (Unterbrechungsfreie Stromversorgung) beispielsweise müssen nicht nur bei einem Ausfall einspringen, sondern auch den Primär- vom Sekundärkreis trennen und so alle Netzstörungen herausfiltern. Die Überwachung der USV ist demnach zwingend notwendig. Auch sollte die Kühlung von der Erzeugung über die Verteilung bis zum Abführen der Wärme stets kontrolliert sein. Denn ohne eine funktionierende Kühlung kommt es zur Überhitzung der Geräte, sodass diese zunächst die eigenen Lüfter hochfahren und sich schließlich selbst abschalten.
Mit Software allein ist es nicht getan: Unternehmen benötigen ein umfassendes Konzept, das alle für einen unterbrechungsfreien IT-Betrieb benötigten Abteilungen und Mitarbeiter in die Überwachung einbindet. Das ist neben der IT-Abteilung unter anderem das Facility-Management, eventuell die Gebäudesicherheit und je nach Verfügbarkeitsanforderung und Branche auch fachliche Mitarbeiter, etwa aus dem Onlineverkauf oder der Produktion. Die Einrichtung eines gewerkeübergreifenden DCIM-Monitorings lässt sich heute mit überschaubarem Aufwand realisieren. Einschlägige Anbieter liefern universelle Treiber zur Integration von Fremdgeräten, wenn diese zum Beispiel kein IP-Protokoll unterstützen, weil sie an die Haustechnik angeschlossen sind. Flexibel konfigurierbare Protokollkonverter leiten die gewünschten Messwerte dann an den IT-Leitstand weiter, wo das Monitoring gewerkeübergreifend vereinheitlicht dargestellt wird.
Wichtig ist zu Beginn, dass IT-Manager schon im Vorfeld der konkreten Planung des Monitorings darauf achten, die Komplexität zu verringern. Anstatt alle verfügbaren Funktionen der DCIM-Software auszureizen, ist es empfehlenswert, sich auf zentrale Kennzahlen rund um das Energie-Management, die Verfügbarkeit und sicherheitsrelevante Parameter zu konzentrieren. Eine Ausweitung der DCIM-Unterstützung in Richtung Überwachung von ITIL-Prozessen (IT Infrastructure Library) kann eine mittelständisch orientierte IT überfordern. Daher sollte man ein solches Projekt in mehrere abgeschlossene Teilprojekte aufteilen. Dann kann die IT die DCIM-Software schrittweise über unterschiedliche Infrastrukturkomponenten hinweg implementieren.
Betriebskonzepte und Zuständigkeiten sind häufig historisch gewachsen. Mit der Einführung einer neuen DCIM-Lösung kann man bestehende Strukturen hinterfragen und gleichzeitig Aufgaben und Verantwortlichkeiten für den IT-Betrieb deutlich transparenter darstellen. Mit einer Neuorganisation der Zuständigkeiten lassen sich Kostenstellen sinnvoller zuordnen oder eine Alarmierung praxisgerechter realisieren, indem man zum Beispiel die Gebäudesicherheit direkt in die Alarmkette einbezieht.
DCIM-Lösungen sind für die Überwachung kompletter Rechenzentren ausgelegt und bieten einen breiten Funktionsumfang. Wer nur einige wenige Server-Schränke betreibt, kommt oft auch mit der Software aus, die der jeweilige Rack-Hersteller anbietet. Insbesondere modular aufgebaute DCIM-Anwendungen lassen sich auch in kleinen Umgebungen sinnvoll einsetzen und schnell implementieren.
Eine initiale Bestandsaufnahme hilft dabei, den IT-Sicherheitsbedarf im eigenen Haus zu ermitteln. Zentrale Fragen sind beispielsweise: Welche IT-Systeme sind geschäftskritisch und daher besonders wichtig? Welche administrativen Aufgaben sind an den IT-Systemen permanent auszuführen? Steht ständig IT-Fachpersonal zur Verfügung? Gibt es nur einen IT-Standort oder existieren mehrere? Anhand dieser und weiterer Fragen können Techniker im ersten Schritt den Sicherheitsbedarf einschätzen und daraus ein Konzept für das Monitoring ableiten. Ein Unternehmen sollte seine Systeme mindestens hinsichtlich Temperatur, Energieversorgung, Zugangssicherheit und Brandschutz überwachen. Laufen beispielsweise bei einem älteren Gebäude Wasser- und Heizungsrohre durch den gleichen Raum, in dem Server-Schränke stehen, sollte man einen Feuchtigkeitsmelder installieren.
Die Komponenten zu Klimatisierung sowie Stromabsicherung und -verteilung kommunizieren über gängige Netzwerkprotokolle mit der Management-Software. Ergänzend lassen sich Sensoren für zahlreiche Betriebsparameter wie Feuchte, Stromaufnahme, Öffnungsstatus der Schranktüren und Temperatur an die Konsole anbinden. Über standardisierte Schnittstellen beispielsweise zu BACnet, einem Netzwerkprotokoll für die Gebäudesicherheit, kann die Software auch das Facility-Management anbinden. Aus der Gesamtschau der Daten lässt sich ein genaues Abbild des aktuellen Status der IT-Systeme erstellen.
Ein häufig übersehener Aspekt besteht darin, dass eine DCIM-Anwendung auch dabei hilft, die Kosten im Rechenzentrum zu optimieren. Eine verbesserte Kostentransparenz im RZ ist insbesondere interessant, wenn IT und Facility-Management am Betrieb der IT-Umgebung beteiligt sind. Klare Kennzahlen, Trends und eine verbraucherorientierte Abrechnung unterstützen die gesamte IT-Organisation dabei, sich wirtschaftlich rentabel aufzustellen.
Wer die IT-Betriebskosten optimieren möchte, muss dafür zunächst den exakten Stromverbrauch bestimmen. Grundlage für ein effektives Energie-Management sind Angaben dazu, wieviel Strom die Server und Netzwerkkomponenten verbrauchen. Power Distribution Units (PDUs) mit Messfunktion geben detaillierten Aufschluss über den Stromverbrauch innerhalb der IT-Schränke. Wer nur wenige Server-Schränke betreibt, kann diese Werte natürlich auch über das Facility-Management ermitteln lassen, beispielsweise mit einem herkömmlichen Stromzähler.
Stört DCIM den laufenden IT-Betrieb? Häufig sind Verantwortliche verunsichert, ob die DCIM-Anwendung den laufenden IT-Betrieb beeinflussen kann, weil hierfür zusätzliche IT-Ressourcen erforderlich sind. Die Anbieter professioneller DCIM-Plattformen haben ihre Lösungen jedoch schon auf einen störungsfreien Betrieb hin optimiert, sodass die zu überwachende IT-Infrastruktur nicht ausgebremst wird. Läuft die DCIM-Software auf einem für diesen Zweck eingerichteten Windows-Server, stehen immer ausreichend Ressourcen zur Verfügung.
Vorschriften wie Basel II verpflichten Unternehmen, bestimmte Standards rund um die IT-Sicherheit einzuhalten. Dazu gehört es auch, laufend zu protokollieren, welche Personen zu welchem Zeitpunkt Zugriff auf die IT-Systeme hatten. Dazu muss die Monitoring-Lösung erfassen, ob und wann die Tür zu einem Server-Schrank geöffnet wurde. Dies ist besonders dann wichtig, wenn die IT-Racks nur in einem einfach gesicherten Technikraum stehen. Für mehr Sicherheit sorgt ein elektrischer Griff in Kombination mit einem Lesegerät: Damit lässt sich auch der Zugriff mehrerer Personen detailliert und automatisiert protokollieren.
Mit DCIM unterstützen IT-Leiter die Transformation des Rechenzentrums hin zu einer Art IT-Fabrik mit vollautomatischen Abläufen. Hat Fachpersonal früher die IT-Komponenten noch manuell gewartet, konfiguriert und überwacht, soll das ideale Rechenzentrum heute weitgehend autonom arbeiten: Die IT-Infrastruktur stellt die für unterschiedliche Workloads benötigten IT-Ressourcen bedarfsgerecht zur Verfügung und berechnet die verbrauchte Leistung nach dem Verursacherprinzip. So verteilen sich die Kosten über alle am IT-Betrieb Beteiligten und jede Stelle kennt ihre Verantwortlichkeiten.
DCIM hilft hier insbesondere dabei, die Energieversorgung und Klimatisierung auf Seiten der Infrastruktur abzusichern, die physische Sicherheit rund um die IT-Racks zu überwachen und eine Brücke zwischen der Infrastruktur und den aktiven IT-Komponenten zu schlagen. Der damit erreichbare hohe Automationsgrad gibt IT-Experten mehr Freiräume für die strategische Weiterentwicklung des Rechenzentrums.
Allerdings ist DCIM kein allumfassendes Werkzeug für alle Aspekte des IT-Betriebs. In der Praxis arbeitet DCIM parallel neben hochspezialisierten Monitoring-Tools, die beispielsweise Netzwerke, Datenbanken oder Applikations-Server überwachen. Am anderen Ende des Spektrums ist in einer heterogenen und komplexen IT-Landschaft noch ein übergreifendes Monitoring-Werkzeug am IT-Leitstand erforderlich, um den Blick aufs Ganze für den Menschen übersichtlich darzustellen.