High-Performance Computing ist seit Langem der Prüfstein für neue Technik, die später im Mainstream-Computing endet. Die Branche verdankt die heutigen Cloud-Systeme und Hyperscale-Implementierungen den HPC-Pionieren, die die Entwicklung von fehlerfreier Hardware, Load-Balancing-Dateisystemen und Open-Source-Software vorangetrieben haben. Noch ist offen, ob der aktuelle Trend der Wasserkühlung im HPC auch seinen Weg in den Mainstream für RZ-Anwendungen findet.
Der Einsatz von Wasser als alternative Kühlmethode zu Kaltluft war bis vor Kurzem weitgehend aus dem Blickfeld geraten, findet mittlerweile jedoch wieder vermehrt Fürsprecher. Wasser war einst die populärste Kühlmethode im Rechenzentrum und ist es für große Mainframes auch heute noch. Mit dem Aufkommen der x86-Architektur in den 1990er- und 2000er-Jahren wurde jedoch die Luftkühlung zum De-facto-Standard.

Im Jahr 2012 stellte das Leibniz-Rechenzentrum (LRZ) in München die HPC-Anbietergemeinschaft (High-Performance Computing) vor eine besondere Herausforderung: Das LRZ wollte den Stromverbrauch drastisch senken, ohne auf Rechenleistung zu verzichten. Das IBM-System-x-Team lieferte einen Server mit direkter Warmwasserkühlung, der ungekühltes Wasser direkt über die CPUs, den Speicher und andere Komponenten mit hohem Stromverbrauch leitete. Dies war die Geburtsstunde der warmwassergekühlten Supercomputer.

Kältemaschinen galten in der Vergangenheit als unverzichtbar beim Thema Wasserkühlung. Das LRZ brach mit diesem Credo und setzte stattdessen auf einen geschlossenen Kreislauf mit frei gekühltem Wasser von bis zu 45 °C. Neben der Energieeffizienz und den Kosteneinsparungen auf Rechenzentrumsebene ergaben sich einige weitere Vorteile. Da sich die CPUs durch die hocheffiziente, direkte Wasserkühlung wesentlich weniger erwärmten, fiel der Energieverlust in den Prozessoren geringer aus. Dies führte zu einer Einsparung von bis zu fünf Prozent gegenüber einem vergleichbaren luftgekühlten Prozessor.

Beim ThinkSystem SD650 sind die Leitungen für das Kühlwasser gut zu erkennen. Bild: Lenovo

Auf Wunsch konnten die Intel-CPUs nun auch konstant im „Turbo-Modus“ laufen und so die Leistung um bis zu 15 Prozent steigern. Da die Systeme keine Lüfter hatten – außer kleinen an den Stromversorgungen – war der Betrieb nahezu geräuschlos. Das im Rechenzentrum erzeugte warme Abwasser ließ sich als Wärmequelle für das Gebäude verwenden. Insgesamt betrug die Energieeinsparung laut LRZ beinahe 40 Prozent.

Mehrere Jahre sind vergangen, und die meisten – wenn nicht sogar alle – großen Hersteller von x86-Systemen sind in irgendeiner Weise (wieder) in die Wasserkühlung eingestiegen. Die Angebote reichen von wassergekühlten Wärmetauschern an der Rückseite von Server-Racks, die wie ein Autokühler funktionieren und die von luftgekühlten Systemen abgegebene Wärme aufnehmen, bis zu Systemen, die in einen Tank mit einem speziellen, dielektrisch verträglichen Kühlmittel getaucht sind.

Auch direkt wassergekühlte Systeme haben sich weiterentwickelt: Fortschritte in Thermik und Material erlauben nun die Aufnahme von Wasser mit einer Temperatur von bis zu 50 °C. Dies macht die Wasserkühlung fast überall auf der Welt ohne den Einsatz von Kältemaschinen möglich. Auch die Anzahl der Komponenten, die mit Wasser gekühlt werden können, ist gestiegen. Neben der CPU und dem Speicher lassen sich auch die I/O- und Spannungsregler mit Wasser kühlen, wodurch der Anteil der vom System an das Wasser übertragenen Wärme auf über 90 Prozent steigt.

Tabelle 1. Energieverbrauch von Intel-Prozessoren.

Es ist nicht möglich, alles im Rechenzentrum mit Wasser zu kühlen. Das LRZ und Lenovo arbeiten gemeinsam daran, die alternative Wasserkühlung zu erweitern: Mit dem aufgeheizten Kühlwasser wird kaltes Wasser erzeugt, das sich anschließend zur Kühlung der restlichen Komponenten im Rechenzentrum wiederverwenden lässt. Bei diesem Verfahren kommen Adsorptionskältemaschinen zum Einsatz, die das heiße Wasser aus dem Kreislauf entnehmen und über ein spezielles Silika-Gel leiten. Das Wasser wird zunächst verdampft und anschließend abgekühlt. Das kondensierte Wasser gelangt dann entweder in Rechenschränke oder in einen Wärmetauscher an der Rückwand eines nicht wassergekühlten Speicher- oder Netzwerkgeräts. Dieser Ansatz ist nur möglich, da das Wasser, das in die Adsorptionskühler geht, heiß genug ist, um den Prozess effizient ablaufen zu lassen. Diese enge Verbindung und Wechselwirkung zwischen dem Server-Equipment und der Infrastruktur des Rechenzentrums birgt ein großes, bislang noch nicht ausgeschöpftes Potenzial.

Riesige Supercomputer-Cluster mit Tausenden von Knoten, PBytes an Speicher und kilometerlangen Verbindungskabeln können die Infrastrukturkosten für den Umstieg auf Wasserkühlung rechtfertigen. Ein durchschnittliches Rechenzentrum, das E-Mail, Datenvorhaltung, CRM und andere wichtige Geschäftsanwendungen betreibt, wird jedoch sicher nicht heute und auch nicht in Zukunft Klempner und Installateure einstellen müssen. Es gibt allerdings gewichtige Faktoren, die Rechenzentrumsbetreiber dazu bewegen werden, in Zukunft über alternative Kühlmethoden nachzudenken – und dies wahrscheinlich früher, als die meisten erwarten.

Das Problem ist nicht Feuchtigkeit, sondern Hitze

Die treibende Kraft hinter der Prozessorinnovation der letzten 50 Jahre war das Mooresche Gesetz, das besagt, dass sich die Anzahl der Transistoren in einer integrierten Schaltung etwa alle zwei Jahre verdoppelt. Nach einem halben Jahrhundert ist es jedoch immer schwieriger geworden, Moores Prognose zu erfüllen. Dennoch bleibt die Aussage Moores die treibende Kraft für das Unternehmen Intel: Vereinfacht gilt, dass heute die Zahl der Kerne pro Chip von Generation zu Generation steigt. Dies führt zu mehr Leistung – und mehr Wärme. Tabelle 1 auf Seite 23 zeigt, wie der Stromverbrauch von Intel-Prozessoren in den letzten zehn Jahren zugenommen hat.

Um die gestiegene Wärmeentwicklung managen zu können, benötigen Prozessoren in einer luftgekühlten Umgebung größere und stärkere Lüfter und andere Wärmesenker; diese setzten wiederum Systeme mit größerem Gehäuse voraus. Die American Society of Heating, Refrigerating, and Air-Conditioning Engineers (ASHRAE) hat die erhöhte Wärmelast in einem Standard-Rack geschätzt, die Zahlen stehen in Tabelle 2.

Tabelle 2. Wärmelast in einem Standard-Rack nach ASHRAE-Berechnungen.

Wahrscheinlich werden die 1HE-„Pizza Box“-Server, die in den letzten 20 Jahren so beliebt waren, auch in Zukunft noch eine wichtige Rolle im Rechenzentrum spielen. Aber sie werden nicht mehr auf die Weise arbeiten können, wie dies in den vergangenen Jahren der Fall war.

Anwender stehen vor einem schwierigen Spagat zwischen Systemdichte und CPU-Leistungsfähigkeit. Rechenzentren, die CPUs mit mehr Kernen nutzen wollen, müssen aufgrund der Wärmeentwicklung auf Platz im Rack verzichten. Dies bedeutet, dass sie mehr Racks aufstellen müssen, was zu höheren Betriebskosten für Immobilien, Strom und Klimatisierung führt.

Unternehmen werden folglich über alternative Kühlmethoden nachdenken müssen, um diese Probleme zu lösen. Direkt wassergekühlte Systeme benötigen keine Kühlkörper von der Größe eines SUVs. Sie ermöglichen es, dass Rechenzentren ihr Profil beibehalten können, ohne Kompromisse bei der Leistung einzugehen.

Umweltfreundlichkeit

Rund 55 Prozent des weltweiten Stroms entsteht aus fossilen Brennstoffen. Auf Rechenzentren entfallen bereits heute fast drei Prozent des weltweiten Strombedarfs. Daher müssen auch Rechenzentren beim Energieverbrauch umdenken und ihren Beitrag zur Senkung des Stromverbrauchs leisten.

Going Green im Rechenzentrum ist also nicht nur ein selbstloses und uneigennütziges Unterfangen. Es ist vielerorts schlicht eine Notwendigkeit. Energiekosten sind heute bereits ein wichtiger Wettbewerbsfaktor, dessen Bedeutung in Zukunft noch zunehmen könnte. Die größte Hürde für alternative Kühlmethoden sind die Kosten für die notwendige Installationsinfrastruktur im Vorfeld.

Finanzabteilungen fragen stets, wie lange es dauern wird, bis sich Investitionen in ein solches System bezahlt machen. Natürlich hängen Total Cost of Ownership (TCO) und Return on Invest (ROI) von der jeweiligen Lösung und den Installationskosten ab. Die meisten Hersteller bieten jedoch TCO-Rechner, die Betreibern bei der Bestimmung des voraussichtlichen Amortisationszeitraums eines direkt wassergekühlten Systems helfen.

Fazit: Alternative Kühlkonzepte sind gefragt

Es besteht kein Zweifel, dass wassergekühlte Systeme ihren festen Platz im HPC haben. Die Experten von Lenovo sind davon überzeugt, dass sich Wasserkühlung in Zukunft auch auf kommerziell genutzte Rechenzentren ausdehnen wird. Blickt man auf das Erscheinungsdatum des aktuellen Intel-Xeon-Platinum-Prozessors im Juli 2017, dann wird klar, dass die meisten Rechenzentren nicht mehr während dessen Ära auf Wasserkühlung umstellen werden. Da es jedoch schwieriger wird, das Mooresche Gesetz zu befolgen und die Rechenleistung kontinuierlich zu steigern, gewinnen alternative Kühlkonzepte an Bedeutung. Viele Unternehmen stehen vor schwierigen und weitreichenden Entscheidungen hinsichtlich Leistung und Größe ihres Rechenzentrums und werden nach Möglichkeiten suchen, die Leistung und Komponentendichte zu maximieren. Wasserkühlung bietet dabei eine Möglichkeit, um Leistung und Dichte zu steigern, die Betriebskosten zu senken und gleichzeitig weniger fossile Brennstoffe zu verbrauchen.

Scott Tease ist Executive Director im HPC-Segment bei Lenovo DCG, www.lenovo.com.