Rechenzentren haben durch steigende Server-Dichten und hohe Anforderungen an die Verfügbarkeit wachsende Energiekosten zu verzeichnen. Dies ist gerade im internationalen Wettbewerb ein ernstzunehmender Kostenfaktor. Aber auch die Ausfallsicherheit hängt stark mit der Energieversorgung zusammen: Eine nicht ausreichend dimensionierte Stromversorgung und Klimatisierung können selbst hochgradig redundant ausgelegte Infrastrukturen lahmlegen, wenn eine der Versorgungsleitungen oder Kühlanlagen ausfällt.

Das Energie-Management in Rechenzentren verfolgt außerdem noch weitere Ziele. Bevor neue Schränke, Reihen oder gar weitere Räume in Betrieb gehen können, muss der Betreiber ermitteln, wie viel Energie und Kühlung noch zur Verfügung stehen. Auch ein potenzieller Defekt an Infrastrukturkomponenten oder Systemen zeichnet sich eventuell im Stromverbrauch ab. Nicht zuletzt ist die Erhebung und Visualisierung des Energie- und Kühlbedarfs die Grundlage für erfolgreiche Optimierungen des Stromverbrauchs und – mit der passenden Software – auch für eine mögliche Umlage der Kosten auf Kunden oder Abteilungen.

Zu diesen Anforderungen an die Optimierung der Ausfallsicherheit, der Planbarkeit und der Kosten kommen bisweilen noch rechtliche Aspekte hinzu. Die europäische Union hat für große Rechenzentren über die DIN-Norm 50600 bereits weitreichende Verpflichtungen für die dauerhafte und feingranulare Messung des Energieverbrauchs festgelegt. Ob und wann eine solche Messung für andere Unternehmensgrößen kommen wird, ist heute noch unklar. Unter dem Schirm der Initiative zur Energieeffizienz existieren bereits einige Förderprogramme, die Unternehmen bei der Einführung solcher Systeme finanziell unterstützen oder Steuererleichterungen bringen.

Infrastruktur mit Sensorik

In Rechenzentren gibt es eine Reihe von Geräteklassen, die Informationen über Energieverbrauch und Kühlung erheben. Klimaanlagen messen die aktuelle Kühlleistung und die Lufttemperatur. Durch die Messung des Stromverbrauchs dieser Anlagen lässt sich anhand des Verhältnisses zur Kühlleistung auch ermitteln, ob eine Wartung der Anlage notwendig ist. Sensorboxen erheben die Temperaturen vor und hinter den Racks, die Luftfeuchtigkeit sowie eventuell auftretende Wasserleckagen und stellen sicher, dass alle Fenster und Türen geschlossen sind.

Die Energiemessung obliegt meist intelligenten Steckdosenleisten (PDUs) genauso wie die Abschaltung von Infrastruktur, damit im Notfall ein Server oder Switch neu gestartet werden kann. Intelligente PDUs sind mit unterschiedlichen Stufen an Intelligenz (Kasten) von einer Vielzahl an Herstellern verfügbar und bereits in vielen Rechenzentren verbaut. Auch der Fehlerstrom lässt sich mit entsprechend ausgestatteten PDUs messen.

Fähigkeiten intelligenter Steckdosenleisten (PDUs)

Schaltbare (switched) PDUs können einzelne Stromausgänge ab- und wieder anschalten. Dies ist bei Softwareproblemen in Switches und anderer Infrastruktur sehr hilfreich, da sich diese nicht wie die meisten Server über ein Out-of-Band-Management wie IPMI neu starten lassen. Für Server mit IPMI stellt dies natürlich auch eine sichere Alternative dar, gerade im Hinblick auf potentielle Sicherheitslücken und den Aufwand für die Verwaltung der IPMI-Netze.

Messende (measuring) PDUs messen den Strom an den Stromeingängen und darüber hinaus auch meist die Spannung.

PDUs mit Mehrfacheingang bieten die Möglichkeit, über die Installation nur einer PDU redundante Systeme vollständig in das Energie-Management einzubinden. Damit lassen sich bei entsprechend ausgelegten PDUs mit nur einer Leiste zwei Stromkreise verwenden und Geräte mit redundant ausgelegten Stromeingängen in Summe messen und schalten.

Per-Port messende PDUs messen den Strom an den Ein- und Ausgängen. Diese Daten können zur Rechnungslegung, detaillierten Verbrauchsoptimierung und potenziell zur frühzeitigen Erkennung defekter Endverbraucher dienen.

PDUs mit Differenzstrommessung messen den Fehlerstrom, also die Differenz zwischen Stromab- und -zufluss. Wenn ein Rechenzentrum – wie durchaus üblich – keinen FI-Schutzschalter im Stromkreis hat, ist die lückenlose Überwachung des Fehlerstrom nicht nur rechtlich angeraten. Diese Messung ist üblicherweise pro Ausgang vorhanden.

Automatic Transfer Switches (ATS) sind streng genommen keine PDUs, funktionieren jedoch ähnlich. Für Geräte ohne redundante Stromversorgung wie etwa ältere Switches, Router oder die meisten GSM-Gateways kann der Betreibermit ihnen eine redundante Stromversorgung sicherstellen. Dazu wird der ATS an zwei Stromleitungen angeschlossen und kann dann je nach Ausführung eine oder mehrere Geräte mit Strom versorgen. Wenn eine Stromversorgung ausfällt, schaltet der ATS in Echtzeit auf die andere Leitung um, die verbundenen Geräte werden dabei nicht ausgeschaltet. ATSs sind immer schaltbar und nehmen üblicherweise auch Messungen vor.

Wenn ein Betreiber bei einer bestehenden Infrastruktur Energiedaten erheben will, ohne neu zu verkabeln oder den Stromfluss zu unterbrechen, bieten sich sogenannte Panelmeter an. Diese verfügen über bis zu über hundert Klappwandler, die potenzial- und berührungsfrei an die jeweiligen Stromadern gehängt werden und den eigentlichen Stromfluss messen, nicht aber die Spannung oder andere Parameter überwachen können.

Auch viele unterbrechungsfreie Stromversorgungen (USVs) messen Eigenschaften des Stromflusses, allein schon um zu ermitteln, wie lange die Batterieleistung den Betrieb aufrechterhalten kann. Neben dem Stromverbrauch stehen dabei Eckdaten der Batterie und der Notstromversorgung zur Verfügung. Da eine USV oft ein ganzes Rack oder einen Raum mit Strom versorgt, sind in diesem Fall keine feingranularen Ergebnisse zu erwarten.

RZ-Monitoring vs. Energie-Management

Fast alle der genannten Geräte lassen sich per SNMP über IP in vorhandene Netze integrieren. Selten erfolgt auch eine Implementierung proprietärer Datenbusse auf Basis von RS485. Prinzipiell lassen sie sich also mit je nach MIB-Größe mehr oder weniger Handarbeit in beliebige SNMP-Monitoring-Systeme wie Nagios oder PRTG einbetten. Diese können dann beim Überschreiten von Schwellwerten Alarm geben und oberflächliche Informationen über den aktuellen Zustand anzeigen. In größeren Rechenzentren stehen oft DCIM-Systeme zur Verfügung, die auch einige der genannten Komponenten ansprechen können, sofern sie zertifiziert sind. Für viele Anwender sind diese Systeme jedoch nicht wirtschaftlich tragbar, allein schon wegen des nötigen Schulungs- und Zeitaufwands. Eine weitere Einschränkung entsteht durch die monolithische Architektur, die eine verteilte Installation unter Umständen erschwert.

Spezialisierte Energie-Management-Systeme haben diese Lücke in den vergangenen Jahren geschlossen. Sie nutzen statt SNMP das jeweils optimale Protokoll für den jeweiligen Sensor, um Daten aus den Geräten auszulesen, und bieten so fein aufgelöste Messdaten. Mitunter erfolgt jede Sekunde eine Messung. Nur so lassen sich Lastspitzen sicher erkennen und die wahre Auslastung einer Stromleitung ermitteln. Ein ideales System ergänzt ein mitunter installiertes DCIM oder SNMP-Monitoring, indem es sich in diese einbinden lässt und erkannte Alarmzustände und Messwerte dort erfasst werden können. Ein Beispiel ist das moderne Energie-Management-System von Om7sense.

Basierend auf diesen fein aufgelösten Messdaten sind nicht nur aktuell ausgeführte Optimierungsarbeiten in Echtzeit erkennbar, auch langfristige Analysen können neben dem Durchschnittswert die wichtigen Spitzenwerte mit abbilden. Bild 1 zeigt eine Analyse der Spannung eines PDU-Ausgangs mit beiden Daten.

Bild 1. Energie-Management-Systeme erheben Daten feingranular und können so neben dem Mittelwert (dunkelblau) auch kurzfristige (grau) und langfristige Extremwerte (grün) anzeigen.

 

In jedem Fall sollten diese Geräte in einem logisch getrennten Netzwerk kommunizieren, denn ein Angreifer kann im schlimmsten Fall durch die Kontrolle der PDUs die Infrastruktur abschalten.

Um die Komplexität eines Rechenzentrums in einzelne, leichter handhabbare Module aufzuteilen, ist seit einigen Jahren der Trend zum „Edge Datacenter” zu erkennen. Dies umfasst ein smartes Rack, das mit lokaler Kühlung und intelligenter Stromversorgung ausgestattet ist. Dieses Rack verfügt auch über ein eingebautes Energie-Management-System, das sich im Idealfall als Komponente in ein bereits vorhandenes Management im Rechenzentrum einfügt. Die angesprochene Abschottung der Energieinfrastruktur vom Internet erhält der Betreiber an dieser Stelle gewissermaßen geschenkt.

Gerade für kleinere und mittlere Installationen sind diese schlüsselfertigen Mini-Rechenzentren eine interessante Alternative. Bestehende Racks lassen sich mit entsprechenden Energie-Management-Systemen ebenfalls zu Smart Racks aufrüsten, was Switch-Ports spart und kritische Systeme vom Netz abschottet, wie es in Bild 2 dargestellt ist.

Bild 2. Manche Lösungen können ein herkömmliches Rack in ein Smart Rack verwandeln, indem die Infrastruktur hinter dem Management-System „verschwindet“.

Rechenzentren haben Laufzeiten von bis zu zwanzig Jahren. In dieser Zeit haben die Hersteller von RZ-Infrastruktur einige Generationswechsel vollzogen – oder im schlimmsten Fall Produkte oder gar das Geschäft eingestellt. Dies ergibt im Regelfall einen Mischbetrieb verschiedener Produktgenerationen und Geräten verschiedener Hersteller. Ein System zum Energie-Management sollte also nicht auf Geräte eines Herstellers festgelegt sein. Außerdem sollte es idealerweise dem Anwender vollen Zugriff auf die erhobenen Daten geben, etwa über die Integration in eine On-Premise-SQL-Datenbank. Damit sind, wie etwa im Messsystem von Om7sense, die Daten später für Bedarfsanalysen, Rechnungslegung oder andere Zwecke weiter verwendbar.

Kevin Read ist Geschäftsführer von OM7sense, www.om7sense.com.