Ausfallrisiken durch Big Data vorhersagen

Präventive Stromanalyse

2. März 2018, 7:00 Uhr | Thilo Püschel

Für eine hohe RZ-Verfügbarkeit muss auch das Stromversorgungskonzept in die Gesamtplanung einbezogen sein. Dazu gehört heute unter anderem die Differenzstromüberwachung, mit der sich auch sicherheitstechnische Anforderungen erfüllen lassen. Moderne Big-Data-Technik kann - basierend auf der Analyse vorhandener Daten - eine drohende Fehlfunktion vorhersagen und damit die Möglichkeit zum präventiven Handeln schaffen.

Die Nutzung von Smart Devices gehört heute zum Lebensstandard. Nachkommende Generationen sehen in der IT ein allumfängliches Hilfs- und Arbeitsmittel. Gleiches gilt für Smart-Home-Systeme, Multimedia-Anwendungen und soziale Plattformen wie Facebook, Twitter oder Instagram. Hinter all diesen Diensten verbirgt sich eine hochvolatile IT-Struktur, deren Zuverlässigkeit und Verfügbarkeit die Nutzer als gegeben voraussetzen.

Verfügbarkeit lässt sich mit diversen Redundanzkonzepten umsetzen. Klassifizierungen für Redundanzen wie Tier I bis IV sind in der Branche hinlänglich bekannt. Der effiziente Betrieb eines Rechenzentrums dagegen ist nur bedingt planbar und von vielen Kriterien abhängig. Oft suchen die Verantwortlichen nach einem Kompromiss aus Verfügbarkeit und Effektivität, denn redundante Systeme arbeiten im Teillastbereich und erreichen somit fast nie ihren optimalen Arbeitspunkt. Hinzu kommen bisweilen standort- oder witterungsbedingte Gegebenheiten, die zum Beispiel die freie Kühlung oder Photovoltaikanlagen sowohl positiv als auch negativ beeinflussen können.

Um den ständigen Streben nach hoher Verfügbarkeit und effizientem Betrieb gerecht zu werden, hat das europäische Regelwerk EN 50600 sowohl die Redundanzkonzepte als auch den anschließenden effizienten Betrieb gleichermaßen bewertet. Im Teil 2-2 der EN 50600 ist die Stromversorgungsanlage eines Rechenzentrums in drei Granularitätsniveaus unterteilt, um feinstufige Messergebnisse zur Bestimmung der Effizienz zu erhalten.

Verfügbarkeit und Betriebskosten

Den sicheren Betrieb eines Rechenzentrums garantieren neben der Redundanz auch definierte Wartungsintervalle. Regelmäßige Wartungen bilden einerseits die Voraussetzung für die Langlebigkeit der Komponenten und Systeme, stellen andererseits jedoch auch einen enormen Kostenfaktor dar. In diesem Umfeld bilden sich derzeit auf dem Markt neue Konzepte, wobei sich die IT-Branche an den Trends in der Automobilindustrie orientiert. Führende Automobilhersteller verzichten bereits seit Jahren auf feste Wartungsintervalle, sondern ermitteln über Sensoren den exakten Zustand von Brems- oder Kupplungsbelägen. Über das Fahrzeuginformationssystem erhält der Fahrzeugführer frühzeitig eine Information darüber, dass sein Fahrzeug zu warten ist oder verschlissene Fahrzeugteile erneuert werden müssen. Außerdem wurden zwischenzeitlich neutrale Werkstätten dazu autorisiert, Wartungen an Fahrzeugen durchzuführen. Die Kunden haben dadurch den Vorteil, sich für eine kostengünstige und zeitoptimierte Lösung zu entscheiden. Warum also nicht nach dem gleichen Prinzip im Rechenzentrum verfahren?

Bild_1_Bachmann_Diagramm_Spannungsglaettung_mit_Kondensator
Schaltnetzteil: Ableitströme durch Netzteile sind in der Regel pulsierende Ströme, dagegen können Fehlerströme durch Bauteileverschleiß als klassische Gleichfehlerströme in Erscheinung treten. Quelle: www.elektronik-fachbuch.de

Die Elektronik insgesamt, vor allem jedoch die Netzteile und Converter erlebten in den vergangenen Jahren permanente Optimierungen. Neben den Einsparungen beim Platzbedarf standen vor allem die Steigerung der Effizienz und die Zuverlässigkeit im Fokus. Prinzipiell ist dies der richtige Ansatz, aber bekanntlich hat jedes Pro auch ein Contra. Moderne Netzteile verfügen hinter dem 230-V-Eingang über einen Gleichrichterschaltung und diverse Bauteile zur Glättung und Siebung der Spannung. Speziell zur Glättung der gleichgerichteten Wechselspannung kommen Kondensatoren zum Einsatz, die am Ausgang des Gleichrichters die Restwelligkeiten der Ausgangsspannung gegen Masse oder Erdpotenzial ableiten. Als Ergebnis steht eine fast homogene Gleichspannung zur Verfügung.

Was geschieht aber mit den über die Kondensatoren abgeleiteten Gleichströmen? Darüber machen sich die Betreiber und IT-Verantwortlichen wenig Gedanken. In großen Rechenzentren, wo sehr viel IT-Equipment im Einsatz ist, können sich die Ableitströme auf dem PE-Leiter (Protective Earth/Schutzleiter/Grün-Gelb) auf mehrere Ampere aufsummieren. Dies stellt in erster Linie eine Gefahr für Leib und Leben dar, weil der PE-Leiter eigentlich eine Schutzfunktion (Grundschutz) innehat. Daher sollten die Verantwortlichen (VEFK - Verantwortliche Elektrofachkraft) auf das Monitoring dieser Ableitströme achten. Die permanente Überwachung dieser Ableitströme versetzt die VEFK jederzeit in die Situation, den elektrotechnischen Zustand des Rechenzentrums richtig einzuschätzen, Abweichungen frühzeitig zu erkennen und entsprechende Gegenmaßnahmen einzuleiten.

Hinzu kommt ein weiterer Vorteil. Die elektrotechnische Infrastruktur eines Rechenzentrums ist letztendlich eine elektrotechnische Anlage, die den Bestimmungen der DIN VDE 0105-100 "Betrieb von elektrischen Anlagen" unterliegt. Gemäß dieser Norm sind elektrotechnische Anlagen in regelmäßigen Abständen erneut zu prüfen. Dazu gehört unter anderem auch die Isolationsmessung, die nur im spannungsfreien Zustand erfolgenden kann. Spannungsfrei bedeutet Abschalten, was für ein Rechenzentrum gewissermaßen als Tabu gelten darf. Dennoch ist auch in den Unfallverhütungsvorschriften (DGUV V3) diese Wiederholungsprüfung gefordert, und für Rechenzentren besteht keine Ausnahme.

Damit befinden sich die Betreiber von Rechenzentren in einem Dilemma. Auf der einen Seite steht die 100-prozentige Verfügbarkeit, und auf der anderen Seite muss die Anlage zum Zweck der vorgeschriebenen Wiederholungsprüfung abgeschaltet werden. Auch in diesem Fall bietet die dauerhafte messtechnische Überwachung eine normative Ausnahme, denn die Messprotokolle lassen sich bei Bedarf auch als Ersatz für die Isolationsmessung im Rahmen einer Wiederholungsprüfung nach DGUV V3 heranziehen.

Doch kaum ein Anwender oder Betreiber sieht sich technisch dazu in der Lage, Ableitströme von fehlerhaften Differenzströmen mit potenzieller Ausfallgefahr für das Rechenzentrum zu unterscheiden. In Abhängigkeit der Netzform (TN-S oder IT-System) kann die Differenzstrommessung oder Isolationsüberwachung zur Anwendung kommen. Erfahrungsgemäß verfügen die meisten Rechenzentren über ein TN-S Netz, was die Konzentration auf die Differenzstrommessung (RCM - Residual Current Monitoring) nahelegt.

Bild_2_Bachmann_Netzteilschaltung
Spannungsglättung per Kondensator: Speziell zur Glättung der gleichgerichteten Wechselspannung kommen Kondensatoren zum Einsatz, die am Ausgang des Gleichrichters die Restwelligkeiten der Ausgangsspannung gegen Masse oder Erdpotenzial ableiten. Quelle: www.elektronik-fachbuch.de

Sowohl die Qualität als auch die Ausfallsicherheit der Betriebsspannung sind in Rechenzentren durch USV-Anlagen gewährleistet. Für Anlagen, in denen unter anderem dreiphasige USV-Anlagen zum Einsatz kommen, werden RCM-Sensoren Typ B gemäß EN 62020 empfohlen. Derartige Sensoren erfassen nicht nur Wechsel- oder pulsierende Gleichströme, sondern auch glatte Gleichfehlerströme wie sie beispielsweise in den Zwischenkreisen der USV-Anlagen oder in den Netzteilen des IT-Equipments entstehen können. Die Sensoren sollten alle relevanten Anlagenbereiche eines Rechenzentrums überwachen und können sogar in die PDUs (Power Distribution Units) der Server-Racks integriert sein. Auf diese Weise sind Fehler einfacher lokalisierbar, und das gesamte RCM-System würde den Granularitätsniveaus 1 bis 3 der EN 50600 entsprechen.

Ableitströme durch Netzteile sind in der Regel pulsierende Ströme, dagegen können Fehlerströme durch Bauteileverschleiß als klassische Gleichfehlerströme in Erscheinung treten. Sind diese Gleichfehlerströme größer als 6 mA, lassen sie sich nur durch RCM-Sensoren Typ B erkennen. Dabei bleibt jedoch die Frage bestehen, wer die Entscheidung zwischen "normal" oder "gefährlich" treffen soll.

Bekanntlich besitzen IT-Administratoren ihre Stärken meist im klassischen IT-Umfeld und nicht in der Analyse von Stromdaten. Dazu gibt es im Unternehmen entweder die verantwortliche Elektrofachkraft (VEFK) - oder der Betreiber übergibt die Verantwortung in fachkompetente externe Verantwortung.

Kompetente Elektrofachunternehmen gibt es genügend, die hier beschriebene präventive Stromanalyse geht jedoch einen Schritt weiter. Die Messdaten der RCM-Sensoren gehen an eine BSI-zertifizierte Cloud-Anwendung und werden dort mit einer Datensammlung (Big Data) von vielen Stromanalysen in weltweiten Rechenzentren verglichen. Auf diese Art und Weise lassen sich die Messwerte der Ableit-/Differenzströme auswerten und von erfahrenen Technikern richtig interpretieren. Bereits existierende Applikationen haben gezeigt, dass das frühzeitige Erkennen ansteigender Differenzströme mit überwiegendem Gleichanteil den drohenden Ausfall von USV-Anlagen analytisch vorhersagen konnte. Sofort eingeleitete präventive Gegenmaßnahmen verhinderten dann einen tatsächlichen Ausfall und waren der Garant für die weitere Verfügbarkeit insgesamt. An dieser Stelle sind Parallelen zur verbrauchsorientierten Wartung in der Fahrzeugindustrie erkennbar.

Sowohl dem Betreiber als auch den IT-Administratoren bieten sich zwei weitere Vorteile. Die Cloud-Applikation sendet dem Betreiber oder Anwender tages- oder wochenaktuelle Reports per E-Mail zu, die auf mögliche oder potenzielle Gefahren hinweisen. Die Messdaten werden aber nicht nur BSI-zertifiziert verarbeitet, sondern auch dauerhaft und fälschungssicher gespeichert. Die daraus resultierenden Messprotokolle können letztendlich auch als Nachweis für das sichere Isolationsniveau der Anlage dienen.

Thilo Püschel ist im Business Development bei Bachmann in Stuttgart tätig, www.bachmann.com.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Tibco

Weitere Artikel zu Freudenberg IT KG

Matchmaker+