Eine Milliarde Sterne der Milchstraße zu vermessen und auf Basis der gewonnenen Daten eine dreidimensionale Karte des Universums zu erstellen: Dieses ehrgeizige Ziel hat sich die europäische Weltraumorganisation ESA für ihre Gaia-Mission gesetzt. Am 19. Dezember 2013 ist eine Sojus-Rakete mit der Weltraumsonde Gaia an Bord vom Weltraumbahnhof Kourou in Französisch-Guayana gestartet, die Mission läuft seitdem.

Seit dem Start von Gaia fallen täglich im Durchschnitt 285 GByte wissenschaftlich relevanter Datensätze an, Schätzungen zufolge insgesamt rund eine Million GByte im Verlauf der gesamten Mission. Der dafür benötigte Speicherplatz entspricht dem Fassungsvermögen von 217.872 DVDs. Angesichts der schieren Masse hochpräziser Daten stellt das Gaia-Projekt entsprechend hohe Anforderungen an das Datenbanksystem, das die Grundlage für eine Erfassung und Verarbeitung der kosmischen Beobachtungen bildet. Eine Nahaufnahme macht deutlich, wie dies gelingt.

Das Ziel von Gaia ist es, eine präzise 3D-Karte von zehn Prozent der Milchstraße zu erstellen und dabei bis zu einer Milliarde Objekte zu kartografieren. Für den Erfolg dieser Mission erfasst die Weltraumsonde im Verlauf ihrer Mission seit 2013 jeden Stern rund siebzigmal, was durchschnittlich 40 Millionen Sternbeobachtungen pro Tag entspricht. Der Satellit, der fast 700 Millionen Euro kostet, ist zwischen 700.000 Kilometer und 1,5 Millionen Kilometer von der Erde entfernt. Aus dieser Entfernung ist es verständlicherweise unmöglich, den Satelliten zu reparieren oder zu betanken. Daher müssen die Funktionsfähigkeit der Hardware und der Software sowie die Sicherheit der Daten einwandfrei gewährleistet sein. Kurz gesagt: Die vom Satelliten erfassten Daten sind unersetzlich.

Die Kamera an Bord des Schiffes ist 938 Millionen Pixel groß und verfügt über 106 ladungsgekoppelte Geräte (CCDs). Dabei handelt es sich um die Art von Bildsensor, die in den meisten Digitalkameras zum Einsatz kommt. Für eine vollständige Drehung um seine Achse benötigt der Satellit sechs Stunden. Sobald die Daten auf der Erde sind, haben die damit betrauten Wissenschaftler 24 Stunden Zeit, um sie zu analysieren.

Gänzlich neuer Blick auf das Universum

Auf Grundlage der Position, der Bewegung und der Helligkeit der Sterne wollen die Forscher Wissenslücken rund um Themen wie stellare, interstellare und dunkle Materie schließen. Außerdem wollen sie Fragen nach der Metallizität und dem Alter der Objekte sowie danach beantworten, ob es sich um Systeme handelt, also solche mit zwei Sternen in unmittelbarer Nachbarschaft. Der Prozess soll ganz neue Einsichten in die Zusammensetzung, Bildung und Entwicklung der Galaxie offenbaren. Inzwischen hat die ESA die größte verfügbare Weltraumkarte präsentiert, die auf Satellitenbeobachtungen zwischen Juli 2014 und Mai 2016 basiert. Die Daten umfassen die Positionen der Sterne, Entfernungsindikatoren und Bewegungen sowie hochpräzise Messungen von Asteroiden in unserem Sonnensystem und auch von Sternen außerhalb der Milchstraße.

Nach Angaben der ESA definieren die vom Gaia-Satelliten gesammelten Beobachtungen die Grundlagen der Astronomie neu. Experten sprachen gar von der größten datentechnischen Herausforderung in der Geschichte der Astronomie. In jedem Fall bedeutet das Projekt einen großen Fortschritt im Vergleich zur ersten Raumfahrtmission des ESA-Satelliten Hipparcos, der vor etwa 30 Jahren rund 118.000 Sterne untersuchte. Die Ergebnisse der Gaia-Mission folgen einem „Open Science“-Konzept und sind prinzipiell jedem zugänglich, der darauf zugreifen möchte. Das europäische Weltraum-Astronomiezentrum (ESAC) mit Sitz in Villanueva de la Cañada bei Madrid ist für das Hosting und die Archivierung der Daten verantwortlich, die der gesamten wissenschaftlichen Gemeinschaft zur Verfügung stehen.

Frei zugängliche Wissenschaftsdaten: Screenshot der ESA-Seite zur Gaia-Mission.

Geschwindigkeit des Daten-Managements

Der Satellit Gaia sendet seine Daten zunächst an das ESAC, wo das Operationszentrum der Mission die Telemetriedaten empfängt, die aus wissenschaftlichen Daten vom Bordteleskop und Hilfsdaten bestehen. Neben der Station Cebreros in Spanien werden die Daten auch von Antennen im australischen New Norcia und dem argentinischen Malargüe erfasst.

Die Rolle des Backend-Systems von Intersystems ist wegen seiner Verarbeitungsgeschwindigkeit in diesem Umfeld von großer Bedeutung: Beim Empfang der Telemetrie werden die Daten dekomprimiert und an die Intersystems-Daten-Management-Plattform übergeben. Diese Technik dient als Arbeitsdatenbank für alle Softwaresysteme, die die Aufgaben der Vorverarbeitung und Verifizierung der Daten und des Zustands der bordeigenen Wissenschaftssysteme sowie der Erstverarbeitung und Bearbeitung der Bilder übernehmen.

Diese Operationen müssen innerhalb von 24 Stunden durchgeführt werden. Argumente für die Wahl des Backend-Systems waren die Zuverlässigkeit und die Leistung bei der Durchführung der komplexen Verfahren. Hinzu kommt, dass es aus Sicht der ESA-Anwender umfassende Ansprüche erfüllt: Neben der Grundvoraussetzung hoher Skalierbarkeit bilden intuitive Handhabung, zuverlässige Bereitstellung und flexible Interoperabilität sowie eine sichere, offene Analyseumgebung zentrale Aspekte des Daten-Managements.

Die Wissenschaftler sind damit in der Lage, den korrekten Status der Instrumente an Bord des Satelliten zu bestimmen. Sie können auch die Qualität der wissenschaftlichen Daten beurteilen, die anschließend an andere Zentren des für die Datenverarbeitung zuständigen DPACs (Data Processing and Analysis Consortium) gehen. Die Organisation setzt sich aus wissenschaftlichen Einrichtungen, Universitäten, Studienzentren und Observatorien aus verschiedenen europäischen Ländern zusammen.

Was das Universum im Innersten zusammenhält

Die Detailfülle der Beobachtungen führte zu einigen überraschenden Entdeckungen. Aufgrund der Geschwindigkeiten konnten die Forscher unter anderem die Kinematik der Galaxie untersuchen. Zum Beispiel ist die Milchstraße vor vielen Jahren mit einer anderen Galaxie zusammengestoßen. Durch Gaia konnten die letzten Phasen sichtbar gemacht werden, in denen beide Galaxien verschmolzen sind – ein seit Jahren in Fachkreisen bekanntes Faktum, das erst mit Hilfe der gewonnenen Daten messbar wurde und mit hoher Wahrscheinlichkeit den Auftakt für weitere wichtige Erkenntnisse bildet.

 

Das Daten-Managementsystem der Datenpipeline der Gaia-Mission

Für die sogenannte Tagespipeline nutzt die ESA die Datenplattform von Intersystems. Die Anforderungen an den zentralen Daten- und Integrations-Hub sind der Aufgabe entsprechend hoch. Für die Zwecke der Gaia-Mission werden die Datenströme persistiert, gelenkt, verarbeitet, untersucht, weitergeleitet und Realtime Analytics unterzogen. Zudem lassen sich Machine-Learning-Algorithmen zeitnah und unkompliziert auf das Datenmaterial anwenden.

Von Rohinformationen zu zuverlässigen Sternenpositionen: Die Rohdaten des Satelliten werden zunächst in höherwertige Ergebnisse umgewandelt, die bereits vorläufige Schätzungen für die Sternpositionen enthalten. Jede dieser Positionen basiert dann jedoch nur auf einer einzigen Messung. Die hohe Genauigkeit von Gaia beruht auf der Kombination aller Beobachtungen, die während der Mission stattfanden, mit einem System namens Astrometric Iterative Solution (AGIS).

Verschiedene Parameter: Das Verfahren kann nicht auf Sternenbasis erfolgen, sondern ist eine globale, gleichzeitige Optimierung einer großen Anzahl von Parametern, einschließlich der fünf astrometrischen Grundparameter jedes Sterns, der zeitvariablen Einstellung des Satelliten und einer Reihe von Kalibrierparametern.

Die Ermittlung von Sternpositionen: Der Prozess ist iterativ und ergibt am Ende die beste Übereinstimmung zwischen den Modellparametern und den tatsächlichen Beobachtungen. Die Sternenpositionen sind zwei der fünf astrometrischen Parameter jedes Objekts.

Stefan Schulte Strathaus ist Manager European Support Center bei Intersystems, www.intersystems.com.