EAsyAnon

Empfehlungs- und Auditsystem zur Anonymisierung

Verschwommene Menschenmenge
Mit Hilfe eines Analyse- und Empfehlungsverfahrens sollen Datensätze besser anonymisiert und damit als Open-Data-Angebote für die Allgemeinheit zugänglich werden. © Adobe Stock / engel.ac

Motivation

In Behörden, Gesundheits- und Forschungseinrichtungen sowie Unternehmen sind zahlreiche Datensätze vorhanden, die potenziell allgemeinzugänglich als sogenannte „Open Data“ veröffentlicht werden können. Oftmals bleiben diese Datensätze jedoch aufgrund von Datenschutzherausforderungen sowie Sicherheits- und Persönlichkeitsrechtserwägungen der Allgemeinheit verborgen und es kann kein gesellschaftlicher Mehrwert daraus geschaffen werden. Zudem ist das zunehmend komplexe Anonymisieren eine weitere Hürde beim Nutzbarmachen der Daten. Die genannten Einrichtungen befinden sich beim Schaffen von Open-Data-Angeboten folglich stets im Spannungsfeld von zu viel oder zu wenig Anonymisierung. Wird zu wenig anonymisiert, könnten zu leicht Rückschlüsse auf die tatsächlichen Dateninhalte möglich werden. Und wird zu stark anonymisiert, können die Datensätze ihren Nutzwert verlieren.

Ziele und Vorgehen

Das Projekt „Empfehlungs- und Auditsystem zur Anonymisierung“ (EAsyAnon) hat zum Ziel, ein Empfehlungssystem zu konzipieren, welches Datenverantwortlichen basierend auf einer standardisierten Metabeschreibung des spezifischen Datensatzes konkrete Empfehlungen zur Anonymisierung gibt. Dabei sollen sowohl die rechtlichen als auch die ethischen Aspekte berücksichtigt werden. Ferner soll ein Auditsystem aufgebaut werden, welches die Zweckmäßigkeit der Anonymität von Datensätzen kontextbezogen bewertet. Dazu werden zum einen automatisierte Methoden entwickelt, die potenziell de-anonymisierbare Teile des Datensatzes erkennen sollen. Zum anderen wird ein sogenanntes „Crowd-Sourced Peer-Review“-Verfahren aufgebaut, in dem Fachleute aus verschiedenen Wissenschaftsdisziplinen vor der Veröffentlichung anonymisierter Datensätze ein Gutachten zur De-Anonymisierbarkeit der jeweiligen Daten erstellen. Für den Fall, dass Teile eines Datensatzes erst zu einem späteren Zeitpunkt veröffentlicht werden dürfen, etwa aufgrund von Fristen oder wenn aufgrund von Hemmnissen keine anonymisierte Veröffentlichung möglich ist, wird ein sogenannter „Trust Service“ entwickelt. Dieser erlaubt es dann mittels Maßnahmen der Pseudonymisierung, schützenswerte Teile eines Datensatzes gemäß der EU-Datenschutzgrundverordnung zu veröffentlichen und verschlüsselte Daten zweckgebunden auszuwerten.

Innovationen und Perspektiven

Die im Projekt anvisierte Kombination eines Empfehlungs- und Auditsystems stellt ein neuartiges Konzept dar, das durch datenschutzkonforme Systeme und Hilfestellungen der Datenanonymisierung, die Veröffentlichung einer größeren Menge an Daten vorantreiben wird. Vor diesem Hintergrund könnten neue offene Datenbanken entstehen, wie zum Beispiel für den Kampf gegen Brustkrebs, die einen hohen Nutzen für Forschende mit sich bringen und Innovationen möglich machen. Dies wird in Konsequenz einen weiteren Standortvorteil der Bundesrepublik Deutschland durch verbesserte technologische Souveränität schaffen.