Unterbrechungsfreie Stromversorgungen (USVs) sind überall dort im Einsatz, wo elektronische Geräte vor Störungen und Stromausfällen zu schützen sind. Sie agieren gewissermaßen als Versicherung der Spannungsversorgung. Doch wie schützt man die USV-Anlagen selbst vor Ausfällen und garantiert eine möglichst hohe Verfügbarkeit des Systems? Nur mehrere zielgerichtete Maßnahmen im Verbund können den Faktor Verfügbarkeit positiv beeinflussen.USV-Anlagen sind heute ein allgegenwärtiger Bestandteil der IT-Umgebungen. Große Anlagen versorgen Server-Räume und Rechenzentren, kleinere Einheiten sorgen dafür, dass Kassensysteme am Point-of-Sale selbst bei Stromausfall die Bezahlung abwickeln können. Eine unterbrechungsfreie Stromversorgung benimmt sich ähnlich wie eine Versicherung: Solange nichts passiert, vergisst man, dass es eine gibt. Dies fördert bei vielen Anwendern den Glauben, dass sie sich blind darauf verlassen können, dass eine USV-Anlage im Ernstfall ihre Schutzwirkung erfüllen wird. Die USV-Anlagenhersteller unterstützen diese Ansicht zusätzlich. MTBF-Werte (Mean Time Between Failure – Durchschnittszeit zwischen Ausfällen) von mehreren Hunderttausend Stunden suggerieren, dass die USV-Anlage zu Lebzeiten problemlos ihre Aufgabe erfüllen wird.
 
Verfügbarkeit und Ausfallwahrscheinlichkeit
Der MTBF-Wert ist auch beileibe nicht falsch, die Entwickler und das Qualitäts-Management der USV-Anlagen-Herstellers ermitteln ihn sorgfältig. Doch eine MTBF ist ein statistisches Konstrukt. Die Definition nach IEC 60050 (191) lautet: „Der Erwartungswert der Betriebsdauer zwischen zwei aufeinanderfolgenden Ausfällen.“ Damit ist nicht gemeint, dass in der durch die MTBF angegebenen Zeitspanne nur ein Ausfall passiert. Am Beispiel der MTBF für Festplatten lässt sich der Zusammenhang verdeutlichen. Üblich sind bei Festplatten MTBF-Werte von 1.200.000 Stunden, das entspricht etwa 137 Jahren. Häufig ist dann die Annahme anzutreffen, dass die Festplatte innerhalb der Nutzungsdauer frei von Ausfällen sein wird. Doch eine MTBF von 1,2 Millionen Stunden bedeutet, dass es bei einer Nutzungsdauer von fünf Jahren mit 3,6-prozentiger Wahrscheinlichkeit zum einem Ausfall kommen wird.
Natürlich deutet eine höhere MTBF auch auf eine höhere Zuverlässigkeit hin. Ein Gerät mit einer MTBF von 100 Stunden wird im Mittel öfter ausfallen als ein gleichartiges Gerät mit einer MTBF von 1.000 Stunden. Dies heißt aber nicht, dass ein Ausfall erst nach 1.000 Stunden auftreten wird.
Hinzu kommt, dass die Techniker die MTBF-Angaben in Laborbedingungen ermitteln. Mit der Einsatzumgebung haben diese dann nicht viel zu tun, Temperaturen können höher, Ein-/Ausschaltzyklen häufiger und mechanische Belastungen (Stöße) größer sein. Wer die MTBF als Grundlage seiner Verfügbarkeitsrechnung verwenden will, sollte also auch entweder die tatsächlichen umgebungs- und funktionsbedingten Beanspruchungen berücksichtigen oder sicherstellen, dass diese Belastungen identisch zum Laborversuch sind.
Und selbst dann ist die Verfügbarkeit noch lange nicht umfassend betrachtet. Der Begriff Verfügbarkeit beschreibt bekanntlich nicht die Zeitspanne, bis ein Ausfall erfolgt, sondern die Zeitspanne, in der ein Dienst oder Gerät die geforderte Leistung erbringt. Läuft das System ein Jahr lang ununterbrochen, beträgt die Verfügbarkeit in dieser Zeitspanne 100 Prozent. Fällt das System eine Woche vor Jahresende aus und bleibt defekt, beträgt die Verfügbarkeit nur um die 95 Prozent. Wird es hingegen innerhalb von fünf Minuten repariert oder ausgetauscht, verringert sich die Verfügbarkeit nur auf die berühmten fünf Neunen (99,999 Prozent). Diesen Faktor drückt der Wert Mean Time To Repair/Recovery (MTTR) aus, also die Zeit, bis ein Fehler wieder behoben ist. Um eine Maßgabe für die tatsächliche Verfügbarkeit zu erhalten, muss die Rechnung (MTBF-MTTR)/MTBF lauten.
 
Knackpunkt Single Point of Failure
Die Verfügbarkeit ist ein entscheidender Wert, um unterbrechungsfreie Stromversorgungen zu beurteilen. Beide Faktoren, MTBF und MTTR, müssen gut sein, um eine gute Gesamtverfügbarkeit zu erreichen. Und beide Faktoren erfordern sinnvolle Maßnahmen in unterschiedlichen Bereichen. Die MTBF hat viel mit den Komponenten eines Geräts zu tun. Qualität, Dimensionierung und bestimmungsgerechter Einsatz sind dabei entscheidend.
Dagegen lässt sich die MTTR am stärksten durch konstruktive Einflüsse verbessern. Der Single Point of Failure ist bei der MTTR ein sehr wichtiges Konzept. Wer in der Konstruktion Komponenten vermeidet, zu denen es keine Alternative gibt und die bei einem Ausfall das System komplett außer Gefecht setzen, trägt wesentlich zu einer guten MTTR bei.
Single Points of Failure (SPoFs) wirken wie Sollbruchstellen in der USV-Anlage, die sich, wenn sie erst einmal eingebaut sind, weder durch Tests, Planung oder Best Practices vermeiden lassen. Dem Anwender stehen zwar einige Möglichkeiten zur Verfügung, um mit einer USV-Anlage ein wirklich ausfallsicheres Gesamtsystem mit extrem hoher Verfügbarkeit aufzubauen, doch den Anfang muss der Hersteller machen. Er kann SPoFs durch das Systemdesign auf Komponentenebene oder durch redundante Funktionsblöcke vermeiden. Die benutzten Bauteile stellen in jedem elektronischen Gerät den Dreh- und Angelpunkt der Langlebigkeit dar. Hochwertige aktive und passive Komponenten altern langsamer, widerstehen Umwelteinflüssen besser und halten die elektronischen Parameter präziser ein. Wenn die berechneten Werte der Schaltung durch exakt dimensionierte Bauteile umgesetzt sind, liegt ihr Betriebspunkt genauer am Optimum. Es gibt weniger Verluste und seltener ungünstige Betriebsbedingungen, die sich negativ auf die Lebensdauer auswirken. Selbst wenn durch die bessere Qualität der Bauteile die Investitionskosten steigen, amortisieren sie sich durch die höhere Lebensdauer und die gesteigerte Verfügbarkeit.
 
Aspekte der Redundanz
Anwender können und wollen die Qualität der Bauteile in der Regel nicht beurteilen, also hilft es nur, sich auf einen etablierten, seriösen Hersteller zu verlassen. Betreiber können sich jedoch das Funktionskonzept der USV-Anlage ansehen und hinterfragen, wie es durch den Hersteller umgesetzt ist. SPoFs zu vermeiden, heißt Redundanzen einzubauen, damit sozusagen immer ein Plan B existiert, wenn es zu Problemen kommt. Dies gilt auch für sekundäre Funktionen wie den Controller. Auch wenn die Bedieneinheit in der Regel nicht verwendet wird, erfüllt sie eine wichtige Aufgabe in der USV-Anlage. Stürzt beispielsweise nur der Display-Controller ab, sodass die USV-Anlage an sich weiterarbeitet, sich jedoch nicht mehr überwachen oder steuern lässt, wird der Anwender das Gerät früher oder später neu starten müssen und damit die Verfügbarkeit für diesen Zeitraum beenden. Sind solche sekundären Funktionen nicht ebenfalls redundant ausgelegt, erzielen die USV-Anlagen nur eine so genannte partielle Redundanz. Die primären Baugruppen der USV-Anlage wie Batterien und Leistungsstufen stehen deutlich mehr im Fokus der Aufmerksamkeit, darum konzentrieren sich darauf die Anstrengungen der Hersteller. Die Batterien sind beispielsweise sehr kritische Bauteile in der Sicherheitskette. Bei einer hochverfügbaren USV-Anlage müssen mindestens zwei voneinander unabhängige und getrennt angeschlossene Batteriesysteme vorgesehen sein.
Wenn eine USV-Anlage lediglich mit einem Strang in Reihe geschalteter Batterien ausgestattet ist, kann das Ausfallrisiko dramatisch ansteigen. Schon eine defekte Batterie im Strang würde die komplette Kette unterbrechen und die Verfügbarkeit im Ernstfall gefährden.
Schaltete man hingegen zwei Batteriestränge parallel, bleibt die USV-Anlage einsatzbereit, auch wenn ein Strang nicht mehr funktioniert. Natürlich muss die USV-Anlage die Batterien in beiden Strängen permanent überwachen und den Administrator bei Problemen alarmieren.
Die Lebensdauer von Batterien ist stets bei einer bestimmten Temperatur – in der Regel 20°C – angegeben. Um diese garantierte Nutzungsdauer zu erhalten, müssen Anwender und Hersteller Sorge tragen, die Batterien innerhalb dieses Temperaturbereichs zu betreiben. Gerade für im Gehäuse eingebaute Akkus ist dies schwierig, da die Elektronik Abwärme erzeugt. Bei extern angeschlossenen Batterien ist es einfacher, sie in einem klimatisierten Bereich zu lagern. Ebenfalls wichtig für die Lebensdauer der Akkus ist das Zugriffskonzept. Die Lebensdauer sinkt, wenn die Batterien häufig beansprucht und dann wieder aufgeladen werden. Die richtige Technik der USV-Anlage kann diesen Faktor positiv beeinflussen.
Doppelwandler-USV-Anlagen der Klasse VFI halten die Ausgangsspannung unabhängig von Schwankungen der Eingangsspannung und -frequenz stabil, bieten also die höchste Schutzwirkung. Sie können in der Regel auch sehr große Abweichungen der Eingangsspannung ausgleichen, ohne auf die Batterien zurückgreifen zu müssen.
 
Trendtechnik Modularität
Dennoch ist es für einige entscheidende Funktionen aus praktischen Gründen unmöglich, Redundanz aufzubauen. Der Wechselrichter einer USV-Anlage ist beispielsweise extrem kritisch für deren Betrieb, lässt sich aber innerhalb einer USV-Anlagen-Schaltung nicht redundant integrieren. Selbstverständlich würde der Ausfall des Wechselrichters die USV-Anlage massiv beeinträchtigen. Um dennoch Redundanz zu gewährleisten, kommen Parallelitätskonzepte zum Einsatz. Parallelität ist Redundanz auf einer höheren Ebene, Makro statt Mikro gewissermaßen. Wenn zwei Batteriestränge eine USV-Anlage versorgen, ist dies bereits Parallelität.
Abstrahiert man die Baugruppen einer USV-Anlage weiter, lässt sich auch die Parallelität stärker nutzen. So verwenden zahlreiche USV-Anlagen, die in den letzten Jahren auf den Markt gekommen sind, einen modularen Aufbau. Mehrere identische Leistungseinheiten mit Wechselrichtern und eigenem Display sind darin über einen gemeinsamen Ausgang synchronisiert. Die Last ist zwischen den Modulen aufgeteilt. Sie sind so dimensioniert, dass sich die gesamte Last durch mindestens n-1 Module versorgen lässt. Fällt ein Modul aus, übernehmen die verbleibenden Leistungseinheiten die Gesamtlast und alarmieren den Administrator.
Ein weiterer Vorteil dieser modularen Redundanz ist die einfache Wartung. Defekte Leistungsmodule können vom Anwender im laufenden Betrieb (Hot-Swap) selbst getauscht und durch ein neues Modul ersetzt werden, das im Idealfall auf Lager liegt. Die MTTR gewinnt dadurch deutlich. Je nach Risikoabschätzung können Anwender n+1, n+2 oder eine andere sinnvolle Redundanzstufe wählen. Selbst mehrfache Ausfälle kompletter Leistungseinheiten würden die Verfügbarkeit nicht beeinträchtigen. Und selbst wenn Module ausfallen, ist die vollständige Redundanz durch den Tausch innerhalb weniger Minuten wieder hergestellt.
Ein schneller und einfacher Modulwechsel soll aber keine Aufforderung an die Kunden sein, alle Wartungsverträge zu kündigen. Am besten ist es immer noch, wenn Fehler gar nicht erst auftreten. Regelmäßige Wartungseinsätze helfen dabei, Fehler im Vorfeld zu erkennen. Zudem ist ein konstantes Monitoring der Betriebswerte einer USV-Anlage notwendig. Dies erfordert normalerweise Kommunikation zwischen USV-Anlage und Hersteller oder Service-Partner, am besten mithilfe einer Netzwerkschnittstelle in der USV-Anlage.
Eine schnelle Reaktion des Service-Partners ist ebenso wichtig, und weil potenzielle Fehler nicht unbedingt zu den üblichen Bürozeiten auftreten, muss der Hersteller Service-Leistungen rund um die Uhr anbieten.
Redundanz durch Modularität gewinnt bei heutigen Rechenzentrumsbetreibern immer mehr Anhänger. Das Prinzip an sich kommt schon seit vielen Jahren zum Einsatz, nur versorgten früher zwei sehr große USV-Anlagen das gesamte Rechenzentrum. Die beiden Geräte waren parallel geschaltet und arbeiteten nur mit 50 Prozent ihrer Gesamtlast. Ein Gerät konnte komplett ausfallen, dann übernahm das Reservesystem die Last. Doch ein solches System war teuer, denn die beiden USV-Anlagen mussten zwangsläufig doppelt so groß dimensioniert werden, wie die maximal zu erwartende Last. Zudem sorgte der Betrieb bei 50 Prozent Last für niedrige Wirkungsgrade.
Ist die Verfügbarkeit einer USV-Anlage also nur von den Maßnahmen und der Strategie des Herstellers abhängig? Auch wenn der Anbieter den größten Einfluss auf die Verfügbarkeit der USV-Anlage hat, sind die Anwender ebenfalls gefordert. Sie können die Betriebsbedingungen der USV-Anlage direkt und zum Guten beeinflussen. Hohe Temperaturen, Schmutz und Staub, elektromagnetische Interferenzen, Störspannungen durch große elektrische Maschinen – es gibt eine ganze Reihe von schädlichen Aspekten für eine USV-Anlage. Abhilfe schafft es, die USV-Anlage in klimatisierten Räumen aufzustellen oder sie – bei kleineren Systemen – in Schranksysteme nach Schutzklasse IP54 einzubauen. Die Umgebungsparameter wie Luftfeuchte, Temperatur und Lastverlauf sollte der Betreiber zudem überwachen, aufzeichnen und regelmäßig analysieren, damit potenzielle Problemsituationen möglichst sichtbar werden.
 
Fazit
Wie hoch die Verfügbarkeit einer USV-Anlage ist, hängt von zahlreichen Faktoren ab. Viele davon liegen in der Hand des Herstellers. Die Qualität der Bauteile und der Fertigung sowie sinnvolle und praxisgerechte Schaltungsdesigns bilden die Basis einer zuverlässigen und stabil arbeitenden USV-Anlage. Mit Parallelität lassen sich zusätzliche Sicherheitsebenen in das Betriebskonzept einziehen, sei es durch eine modulare USV-Anlage oder durch Parallelität im Betrieb, mit mehreren, zusammengeschalteten Einzelgeräten. Und zu guter Letzt kann auch der Anwender durch sinnvoll gewählte und überwachte Umgebungsbedingungen zu einer hohen Verfügbarkeit beitragen.

Verfügbarkeit von klassischen und modularen USV-Systemen.

Zu den wichtigen Punkten zählt ein einfacher Modultausch.

Modulare USV-Anlage: im Bild Newave Energy.