Bei Gesichtern funktioniert das ähnlich. Generative Adversarial Networks (GANs) erzeugen real aussehende Gesichter von nicht existierenden Personen. Der Anonymisierungstrick ist letztlich der Ersatz des echten Gesichts durch ein künstliches. Dabei lassen sich alle wichtigen Merkmale des Originalgesichts übernehmen: Alter, Geschlecht, die Farbe von Haut, Haaren und Augen sowie Blickrichtung und Gefühlsausdruck. Doch der von dem GAN genutzte Verfremdungseffekt führt dazu, dass die Personen für menschliche und maschinelle Betrachter nicht mehr erkennbar sind. Eine nachträgliche Identifizierung ist nicht mehr möglich. Zudem ist die Anonymisierung durch synthetische Gesichter anschließend nicht umkehrbar.
Das Anonymisierungsverfahren heißt Deep Natural Anonymization (DNAT) und besitzt eine EuroPriSe-Zertifizierung für datenschutzkonforme IT-Produkte. Diese Anonymisierungstechnik ist viel hilfreicher als das bisher übliche Unkenntlichmachen von Gesichtern und Nummernschildern. Gesichtsmerkmale und physische Attribute sind immer noch erkennbar und die Daten sind dadurch zum Trainieren maschineller Lernmodelle geeignet.
Ein wichtiger Verarbeitungsschritt bei Computer Vision ist die Segmentierung des Ausgangsbildes. Vereinfacht ausgedrückt sind dabei inhaltlich zusammenhängende Regionen durch Zusammenfassung benachbarter Pixel gekennzeichnet. Im Anschluss entsteht eine sogenannte Segmentierungskarte, die sich zum Beispiel bei der Objekterkennung nutzen lässt. Die Segmentierung vereinfacht das dargestellte Objekt, sodass es sich anhand weniger Merkmale einordnen lässt. Eine einfache Form der Segmentierung ist zum Beispiel das Nachzeichnen der Umrisse eines Objekts.
Je präziser die Segmentierung der Rohdaten, desto besser ist der Lernerfolg bei neuronalen Netzen. Die Abbildung zeigt Beispiele für Segmentierungskarten (unten) anhand unterschiedlicher Rohdaten (oben). Die ersten drei Spalten zeigen die Bilder und Segmentierungskarten von Gesichtern, die mit herkömmlichen Anonymisierungsalgorithmen bearbeitet sind. Vor allem die beiden Blurring-Verfahren arbeiten sehr effektiv.
Interessant ist der Unterschied zwischen Originalbild (ganz rechts) und der DNAT-Anonymisierung. Die Segmentierungskarten zeigen viele Ähnlichkeiten, die Physiognomie des Originalgesichts bleibt erhalten. Das künstliche Gesicht eignet sich also für weitergehende Analysen. Doch es ist im Vergleich zum Original „entindividualisiert“ und nicht mehr als eine bestimmte Person erkennbar, in diesem Fall die Schauspielerin Reese Witherspoon. Hierdurch ist das künstlich erzeugte Bild DSGVO-konform, erhält aber trotzdem die Datenqualität des Originals.
Fazit: DSGVO-Konformität auch bei Gesichtserkennung
Nur bei wenigen umstrittenen Anwendungen für künstliche Intelligenz geht es um die tatsächliche Erkennung einer individuellen Person. Zahlreiche Einsatzgebiete für die Auswertung von Gesichtern haben deutlich weniger spektakuläre Hintergründe. So gibt es denkbare Anwendungen im Bereich der Marktforschung, bei psychologischen Apps oder bei der Überwachung von Massenveranstaltungen, um anhand von Gesichtsausdrücken eine Massenpanik vor ihrem Auftreten zu erkennen. Weitere Möglichkeiten sind denkbar, KI-Startups werden hier in den nächsten Jahren sicher noch kreative Ideen haben.
Voraussetzung für den Einsatz von erkennbaren Gesichtern als Trainingsmaterial für ein künstliches neuronales Netz ist jedoch die DSGVO-Konformität der Daten. Die wiederum müssen aber hochwertige Segmentierungskarten mit großer Datenqualität ergeben – anders funktioniert das Training nicht. Deshalb sind für das Zeitalter der künstlichen Intelligenz bessere Anonymisierungstechniken als der altbekannte schwarze Balken nöttig. Deep Natural Anonymization stellt den Datenschutz für das Training von neuronalen Netzen auf ein neues Level.
Marian Gläser ist Mitbegründer und CEO von Brighter AI.