Schwärzen, Verpixeln oder Verschmieren anonymisiert Gesichter in Bildern für den Datenschutz, erschwert aber die sinnvolle Datennutzung für das Training von KI-Anwendungen. Eine Alternative ist es, Gesichter durch künstliche zu ersetzen – mit Hilfe von KI.

Gespeicherte Gesichter auf Fotos oder Videos von allgemein zugänglichen Orten und öffentlichen Veranstaltungen sind vor der Nutzung unkenntlich zu machen, wenn es keine Vereinbarung mit der jeweiligen Person oder eine andere Rechtsgrundlage gibt. So lässt sich grob eine wichtige Grundregel der europäischen Datenschutzverordnung DSGVO zusammenfassen. Denn der Gesetzgeber hat festgelegt: Personenbezogene Daten darf man nur zweckgebunden verarbeiten. Wer zum Beispiel in einem Onlineshop einkaufen will, muss seine Daten angeben, da die Verarbeitung der Daten in diesem Kontext erfolgt. Man akzeptiert damit den Zweck und es gibt keinen Konflikt mit dem Datenschutz. Der entsteht erst dann, wenn die Kundendaten für andere Zwecke in Verwendung sind, etwa individualisierte Werbung.

Die Lösung der DSGVO: Die Person muss der Verarbeitung zustimmen, dann lassen sich die Daten nutzen. Allerdings ist es bei vielen Anwendungen, wie etwa der Auswertung von Massendaten, illusorisch, auf die Zustimmung aller Personen zu hoffen. Eine einmal erteilte Einwilligung lässt sich jederzeit ohne Angabe von Gründen widerrufen, so dass diese Lösung auch keine Rechtssicherheit bietet. Deshalb räumt die DSGVO Unternehmen das Recht ein, anonymisierte Daten zu speichern und zu nutzen. Dafür muss der Personenbezug aus allen Daten vollständig entfernt sein. Dann ist es möglich, sie für statistische Auswertungen oder Forschungsprojekte zu nutzen.

Das gilt auch für Fotos oder Videos. Ein Beispiel: Ein Anbieter von künstlicher Intelligenz möchte seine Software darauf trainieren, die Gesichtsausdrücke von Menschen zu erkennen, um in der Marktforschung das Einkaufsverhalten anhand von Videos analysieren zu können. Der Datenschutz verbietet zum Beispiel die Nutzung von identifizierbaren Gesichtern ohne Einwilligung oder berechtigtes Interesse. Sie gehören als persönliches Merkmal zu den geschützten Daten – deshalb macht man sie unkenntlich. Übliche Verfahren für die Anonymisierung von Gesichtern sind Schwärzung, Verpixeln oder Blurring (Verwischen). Die entsprechenden Algorithmen haben aber für das KI-Training einen Nachteil: Soziologische Personenmerkmale wie Geschlecht, Alter, Blickrichtung oder Emotionen sind nicht mehr klar erkennbar und die Datenqualität sinkt.

Künstliche Gesichter und Autokennzeichen für den Datenschutz

Herkömmliche Anonymisierungsverfahren können nicht die Genauigkeit und Integrität der Originaldaten bewahren. Doch genau das ist für Anwendungen im Bereich der künstlichen Intelligenz und des maschinellen Lernens das Rückgrat. Hochwertige Daten sind eine wichtige Grundlage, um KI-Modelle präzise zu trainieren.

Ähnliches gilt auch für Nummernschilder von Autos, die ebenfalls Bestandteil des Trainingsmaterials von autonomen Fahrzeugen sind. Sie sind personenbezogene Daten, das sie es möglich machen, den Halter des jeweiligen Fahrzeugs zu identifizieren. Deshalb sind auch die Kennzeichen zu verpixeln.

Unternehmen riskieren bei Verstößen gegen die Anonymisierungspflicht Geldstrafen, den Verlust des Kundenvertrauens und eine Schädigung ihres Rufs und ihrer Marken. Um diesen Schwierigkeiten aus dem Weg zu gehen und trotzdem Gesichter und Nummernschilder als Trainingsmaterial nutzen zu können, gibt es einen Trick: Ein neuronales Netzwerk zur Bildverarbeitung (Computer Vision, CV) ersetzt echte Gesichter und Kennzeichen durch künstliche Objekte, die aber wesentliche Merkmale weiter beinhalten.

Am einfachsten lässt sich das bei den Kennzeichen erklären: Ihr Aufbau ist gleichartig. Die ersten Zeichen geben die Stadt oder den Landkreis an, die folgenden sind individuell einem bestimmten Autohalter zugeordnet. Nun ersetzen die Unternehmen im Bild das originale Kennzeichen durch ein künstliches. Es besteht aus einer beliebigen Kombination von Buchstaben und Ziffern, die in dieser Form nicht von den Behörden in Benutzung ist.

Seite 1 von 2