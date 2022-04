Mit zwei Neuerungen will HPE die Analyse von Datenbestände erleichtern und bei KI-Projekten den Erkenntnisgewinn erhöhen: Das HPE Machine Learning Development System soll Entwicklung und Training von ML-Modellen beschleunigen, HPE Swarm Learning soll organisationsübergreifend präzisere KI-Ergebnisse liefern – und das ohne Datenschutzprobleme.

Webervögel sind die Stars des Nestbaus: Das Männchen konstruiert aufwendig ein möglichst kunstvolles Hängenest, um damit das Weibchen anzulocken. Gefällt dem Weibchen das Nest, übernimmt es den Innenausbau. Die Nestkonstruktion ist für diese Vogelfamilie somit ein aufwendiger, iterativer Prozess, nicht unähnlich dem Entwickeln und Trainieren von ML-Modellen (Machine Learning). Eine besondere Herausforderung in der ML-Entwicklung ist es laut Justin Hotard, EVP und General Manager der HPC & AI Business Group von Hewlett Packard Enterprise (HPE), Modellentwicklung und -training zu skalieren. Denn das Modelltraining ist komplex und zeitaufwendig: ML-Entwickler, so Hotard, seien heute gezwungen, sich auf die Verwaltung der Infrastruktur zu konzentrieren statt auf die Schaffung von Mehrwert. Der schlichte Grund dafür: Die anspruchsvollen KI/ML-Workloads fühlen sich nur in spezialisierter HPC-Umgebung (High-Performance Computing) zu Hause. Solche HPC-Angebote aber seien unflexibel und im großen Maßstab kostspielig, so Hotard.

Um die Modellentwicklung mit einer flexiblen Infrastruktur zu beschleunigen und die Zusammenarbeit des Entwicklungsteams zu verbessern, übernahm HPE im Juni letzten Jahres den KI-Spezialisten Determined AI. Im September stellte der Konzern deren kollaborative ML-Entwicklungsplattform als HPE Machine Learning Development Environment vor. Diese ergänzt HPE nun um das Machine Learning Development System, einen voll integrierten, gebrauchsfertigen Stack aus Hardware, Software und Services. Damit, so Hotard, könne man die ML-Entwicklungszeit von Wochen auf Tage verkürzen.

Komplettsystem für KI-Forschungsteams

Laut Evan Sparks, einst Gründer von Determined AI und nun VP AI bei HPE, zielt das ML-Entwicklungssystem auf KI-Forschungsteams, die Werkzeuge benötigen, um den Entwicklungsprozess zu beschleunigen, Projekte automatisch zu skalieren und während des gesamten Entwicklungsprozesses mit vor- und nachgelagerten Workflows zusammenzuarbeiten. Es besteht aus einem HPC-Cluster mit HPE-Hardware, einer Switching Fabric, dem HPE Performance Cluster Manager für die Administration und dem erwähnten Machine Learning Development Environment.

Aufbau des Machine Learning Development System von HPE.

Das Machine Learning Development System gibt es als Basismodul mit Erweiterungsoptionen. Die Basisvariante besteht aus vier Apollo 6500 Gen10+ Servern, bestückt mit acht Tensor-Core-GPUs von Nvidia und 80 GByte Arbeitsspeicher, sowie drei ProLiant DL325 Gen10+ Service Nodes, zwei Aruba 6300M GbE-Switches, einem HDR-InfiniBand-Switch und optional einem Storage-Cluster. Die Software läuft auf Red Hat Enterprise Linux und in Docker-Containern. Das System ist schlüsselfertig vorkonfiguriert, so Hotard, beim Setup und Anpassungen könne HPEs Services-Organisation Pointnext aber unterstützen. Das System ist ab sofort bei HPE und über Vertriebspartner erhältlich.

Als Referenzkunden nannte HPE Aleph Alpha: Der „NLP as a Service“-Anbieter (Natural Language Processing, Verarbeitung natürlicher Sprache) aus Heidelberg trainiert laut HPE-Angaben mit dem neuen System auf der Basis von 64 Apollo-Servern sein multimodales KI-Modell, das NLP und Computervision verbindet: Das Modell kombiniere Bild- und Texterkennung für fünf Sprachen mit einem menschenähnlichen Kontextverständnis. „Das HPE Machine Learning Development System gibt uns eine erstaunliche Effizienz und eine Leistung von mehr als 150 Teraflops“, sagte Jonas Andrulis, Gründer und CEO von Aleph Alpha, und lobt: „Wir konnten mit dem Modelltraining innerhalb von Stunden anstatt erst nach Wochen beginnen.“

