Blade-Server

Für hochverfügbare Anwendungen

17. Dezember 2006, 23:00 Uhr | Peter Dümig/dp Der Autor ist Produkt- Manager Server bei Dell in Langen.

Blade-Server eignen sich besonders für hochverfügbare Anwendungen. Denn mit ihnen lassen sich Komponenten wie Netzteile oder LAN-Anschlüsse im laufenden Betrieb redundant erweitern. Dies ist mit Rackservern nicht so einfach zu realisieren.

Die Server-Landschaft in den Rechenzentren hat sich in den letzten zehn Jahren massiv gewandelt:
Wo früher eine Mixtur unterschiedlichster monolithischer Rechner stand, haben sich heute auf
Industriestandards beruhende Rack-Server durchgesetzt – nicht zuletzt wegen ihres attraktiven
Preis-Leistungs-Verhältnisses. Ab sechs bis acht neu anzuschaffenden Rackservern bilden Bladeserver
eine interessante Alternative. So lassen sich beispielsweise in einem sieben Höheneinheiten (HE)
fassenden Gehäuse (1HE = 4,45 cm) zehn senkrecht einzuschiebende Blades mit jeweils zwei
Xeon-Prozessoren unterbringen. In einen 19-Zoll-Schrank passen dann sechs Blade-Gehäuse mit
insgesamt 120 Prozessoren. Würde der Administrator Rackserver mit Dual-Prozessoren verwenden,
hätten im gleichen Gehäuse in der Summe nur 84 CPUs (42 1-HE-Systeme) Platz.

Die Anschaffungskosten für Hardware sind um 20 bis 25 Prozent niedriger, da alle Blades
Ressourcen wie Strom, Netzteile, Lüfter, Managementkarten und Netzwerk-Switches gemeinsam nutzen.
Während es bei Rackservern eine getrennte Stromversorgung für Netzteil und Kühllüfter gibt,
zeichnen sich Bladeserver dadurch aus, dass Netzteile und Kühllüfter in einem einzigen Gehäuse, das
mit Strom versorgt werden muss, untergebracht sind. Dadurch reduziert sich der Stromverbrauch pro
Server, aber auch die notwendige Verkabelung: bei den Leitungen lassen sich Einsparungen um bis zu
70 Prozent erzielen. Im direkten Vergleich mit Rackservern bringen es die Blades auf eine erheblich
höhere Rechenleistung pro Einbauschrank, und sie bieten durch redundant ausgelegte Komponenten eine
höhere Verfügbarkeit. Dazu trägt zusätzlich bei, dass die wichtigsten Komponenten im laufenden
Betrieb austauschbar sind. Bei Rackservern ist das nur eingeschränkt möglich.

Forderung: kein Single Point of Failure

Das Konstruktionsprinzip der Redundanz bedeutet: Es existiert kein Single Point of Failure.
Gemeint ist damit im Allgemeinen eine Komponente, deren Fehlfunktion den Komplettausfall eines
Systems nach sich ziehen würde. Recht anfällig dafür ist die Stromversorgung. Wird für Bladeserver
eine hohe Verfügbarkeit angestrebt, empfiehlt sich bereits bei der Festlegung der Konfiguration auf
redundante Netzteile zu achten.

In den Chassis von Servern überwachen spezielle Remote-Access-Controller das gesamte System. Ein
solcher Controller verfügt über Funktionen für die Leistungskontrolle, Ereignisprotokollierung und
Inventar-Reporting. Mit diesem Administrations-Tool können Unternehmen ein Set von Regeln
definieren, die unter anderem beim Ausfall eines Netzteils Anwendung finden. Sind zwei plus zwei
(also insgesamt vier) Netzteile vorhanden, bietet es sich an, ein Duo in Reserve zu halten: Selbst
wenn im laufenden Betrieb dann ein oder zwei ausfallen sollten, ist die Verfügbarkeit
gesichert.

Redundanz bei I/O-Modulen

In den Gehäusen, in denen die Blades eingebaut werden, ist häufig Raum für vier I/O-Module.
Nicht ungewöhnlich ist, dass zwei der Module für Ethernet-Anschlüsse reserviert sind, die anderen
beispielsweise für Fibre Channel oder Infiniband. Aus Redundanzgründen sind die I/O-Module meist
paarweise konfiguriert. Diese redundant ausgelegten Datenpfade sind nicht von vornherein in den
Bladeservern eingebaut, der Administrator muss sie per Konfiguration entsprechend festgelegen.
Erforderlich ist die Redundanz der Datenpfade beispielsweise dann, wenn er eine besonders hohe
Verfügbarkeit bei Lese- und Schreibzugriffen auf die Storage-Medien anstrebt. Das ist besonders bei
transaktionsintensiven Applikationen der Fall.

Jedes Server-Blade verfügt in der Regel über zwei integrierte LAN-Anschlüsse (LOM = LAN on
Motherboard), die über dedizierte Verbindungen mit den internen Ports der Switches oder der
Pass-Through-Module verbunden sind. Die LOMs bieten häufig 1-GBit/s-Full-Duplex-Leitungen.

Nun besteht ein wichtiger Unterschied zwischen Blade- und anderen Servern darin, dass die
Verbindung zwischen dem LOM und den internen Ports der integrierten I/O-Module (Switch oder
Pass-Through) im Bladeserver über das Midplane fest verdrahtet ist. Die Konsequenz dieses Designs:
Der Link zwischen dem LOM und dem integrierten I/O-Modul bleibt im Status "connected" – es sei
denn, dass entweder das LOM-Modul oder der I/O-Port ausfällt. Das gilt auch für den Fall, dass
keine LAN-Verbindung zwischen den externen Uplink-Ports und dem integrierten Switch besteht.
Umgekehrt bedeutet das jedoch, dass ein externer Fehler wie ein Kabelbruch keine Fehlermeldung in
einem Konfigurationsszenario erzeugt, in dem ein integrierter Switch genutzt wird.

Ist ein Pass-Through-Modul präsent, befindet sich der Link nur dann im Status "connected", wenn
eine Verbindung zwischen den externen Ports des Pass-Through-Moduls und dem Switch außerhalb des
Blade-Chassis besteht. So würde sich auch ein Stand-alone-Server verhalten. Zu einer Fehlermeldung
kommt es, wenn ein entsprechender Event im LOM, Pass-Through-Port oder im externen Switch
eintritt.

Umgehen lässt sich diese Limitierung der Redundanz beziehungsweise Verfügbarkeit über die
Administrationseinstellung in der Firmware eines Switches. Ein Layer-2-Switch aggregiert den
Datenverkehr der Gigabit-Netzwerk-Controller-Verbindungen der einzelnen Bladeserver und bietet
dabei sechs Uplink-Anschlüsse zur Infrastruktur des Hauptnetzwerks. Über einen entsprechenden
Konfigurationsbefehl unterstützt der Switch dann LAN-Teaming.

Redundanz im LAN und SAN

Anders sieht die Sache aus, wenn statt eines Switches ein Pass-Through-Modul zum Einsatz kommt.
Das Pass-Through-Ethernet-Modul ist eine Option für Anwender, die eine vorhandene LAN-Infrastruktur
weiterhin nutzen möchten. Ein Pass-Through-Modul ist ein Gerät, das den Datenverkehr direkt vom
Bladeserver an ein externes LAN-Device weiterleitet. Pass-Through-Module sind in einer
Eins-zu-Eins-Beziehung mit dem Anschluss für den Bladeserver verbunden. Das entspricht der
Verkabelung von den Netzwerkkarten eines herkömmlichen 1-HE-Servers zum externen Netzwerkgerät. Das
Ethernet-Pass-Through-Modul unterstützt bis zu zehn 1000BaseT-Uplinks.

Das Fibre-Channel-Pass-Through-Modul bietet wie das Pass-Through-Ethernet-Modul eine nahtlose
Verbindung zu externen Fibre-Channel-SAN-Switches. Eine opti-onale Fibre-Channel-Zusatzkarte auf
der Hauptplatine der Bladeserver übernimmt dabei die Weiterleitung vom Midplane an das
Fibre-Channel-Pass-Through-Modul, den externen Fibre-Channel-Switch und schließlich an das
Storage-System. Sind bereits Fibre-Channel-Switches vorhanden, kann der Anwender die vorhandene
Infrastruktur weiterhin nutzen und so deutliche Einsparungen erzielen. Das
Fibre-Channel-Pass-Through-Modul ist bei Dell zum Beispiel standardmäßig mit zehn optischen
Kurzwellen-Transceivern ausgestattet.

Für "High Performance Computing Cluster" (HPPC), die maximalen Durchsatz und geringe Latenz
erfordern, besteht die optimale Lösung aus einem Topspin-Infiniband-Pass-Through-Modul, das jeweils
mit einer Topspin-Infiniband-HBA-Zusatzkarte in den einzelnen Bladeservern sowie mit einem externen
Topspin-Switch 120 oder 270 verbunden ist. Über redundante Verbindungen vom HBA zu den externen
Switches bietet diese Hochleistungslösung einen Durchsatz von bis zu 10 GBit/s (vierfach).

Management und hohe Verfügbarkeit

Die redundant ausgelegten technischen Komponenten wie Netzteile, I/O-Module und LAN-Verbindungen
bilden die Grundausstattung einer hohen Verfügbarkeit. Abgerundet werden diese physikalischen
Bausteine durch Vorkehrungen im Managementbereich. Neben dem standardmäßig vorhandenen
Remote-Access-Tool gibt es in aller Regel die Möglichkeit, einen zweiten Remote-Access-Controller
zu implementieren, der dann eine aktive/passive Redundanz bietet.

Die Prozedur sieht dann folgendermaßen aus: Während das erste Tool aktiv den Status aller
Komponenten überwacht, wartet das zweite passiv auf Events. Erst im Fehlerfall wird vom bislang
aktiven auf das passive Modul umgeschaltet. Damit sind alle zentralen Bausteine in einem
Blade-server doppelt ausgelegt und auch optimale Vorkehrungen für eine sehr hohe Verfügbarkeit
getroffen.


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+