Datenanonymisierung
Was ist Datenanonymisierung?
DatenanonymisierungUnwiderrufliche Umwandlung personenbezogener Daten, sodass keine Person mehr direkt oder indirekt – auch nicht durch Verknüpfung mit anderen Informationen – identifizierbar ist.
Die Anonymisierung entfernt oder verändert Identifikatoren, Quasi-Identifikatoren und sensible Attribute so, dass eine Re-Identifikation nicht mehr mit angemessenem Aufwand möglich ist. Übliche Techniken sind Unterdrückung, Generalisierung, Perturbation, Aggregation und Randomisierung, häufig anhand von Modellen wie k-Anonymität, l-Diversität, t-Closeness oder Differential Privacy bewertet. Echte Anonymisierung fällt nicht unter die DSGVO (Erwägungsgrund 26), die Hürden sind jedoch hoch: EDSA und CNIL fordern eine formale Re-Identifikations-Risikobewertung unter Berücksichtigung "vernünftigerweise wahrscheinlicher" Mittel und Hilfsdatensätze. Typische Fehler sind das alleinige Hashen, das Veröffentlichen hochdimensionaler Mikrodaten oder das Gleichsetzen von Pseudonymisierung mit Anonymisierung.
● Beispiele
- 01
Veröffentlichung von Krankenhaus-Wiederaufnahmestatistiken aggregiert nach Region und Quartal, Zellen unter fünf werden unterdrückt.
- 02
Veröffentlichung eines öffentlichen Mobilitätsdatensatzes, dessen Trajektorien auf Stadtteil-Wochen-Granularität generalisiert sind.
● Häufige Fragen
Was ist Datenanonymisierung?
Unwiderrufliche Umwandlung personenbezogener Daten, sodass keine Person mehr direkt oder indirekt – auch nicht durch Verknüpfung mit anderen Informationen – identifizierbar ist. Es gehört zur Kategorie Datenschutz der Cybersicherheit.
Was bedeutet Datenanonymisierung?
Unwiderrufliche Umwandlung personenbezogener Daten, sodass keine Person mehr direkt oder indirekt – auch nicht durch Verknüpfung mit anderen Informationen – identifizierbar ist.
Wie funktioniert Datenanonymisierung?
Die Anonymisierung entfernt oder verändert Identifikatoren, Quasi-Identifikatoren und sensible Attribute so, dass eine Re-Identifikation nicht mehr mit angemessenem Aufwand möglich ist. Übliche Techniken sind Unterdrückung, Generalisierung, Perturbation, Aggregation und Randomisierung, häufig anhand von Modellen wie k-Anonymität, l-Diversität, t-Closeness oder Differential Privacy bewertet. Echte Anonymisierung fällt nicht unter die DSGVO (Erwägungsgrund 26), die Hürden sind jedoch hoch: EDSA und CNIL fordern eine formale Re-Identifikations-Risikobewertung unter Berücksichtigung "vernünftigerweise wahrscheinlicher" Mittel und Hilfsdatensätze. Typische Fehler sind das alleinige Hashen, das Veröffentlichen hochdimensionaler Mikrodaten oder das Gleichsetzen von Pseudonymisierung mit Anonymisierung.
Wie schützt man sich gegen Datenanonymisierung?
Schutzmaßnahmen gegen Datenanonymisierung kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.
Welche anderen Bezeichnungen gibt es für Datenanonymisierung?
Übliche alternative Bezeichnungen: Anonymisierung, Starke De-Identifikation.
● Verwandte Begriffe
- privacy№ 875
Pseudonymisierung
Verfahren, das direkte Identifikatoren in personenbezogenen Daten durch umkehrbare Aliasse ersetzt, sodass die Daten ohne separat verwahrte Zusatzinformationen keiner Person mehr zugeordnet werden können.
- privacy№ 576
k-Anonymität
Privacy-Modell von Latanya Sweeney, das verlangt, dass jeder Datensatz anhand seiner Quasi-Identifikatoren von mindestens k-1 anderen Datensätzen ununterscheidbar ist.
- privacy№ 603
l-Diversität
Erweiterung der k-Anonymität von Machanavajjhala et al., die in jeder Äquivalenzklasse mindestens l gut repräsentierte Werte für jedes sensible Attribut verlangt.
- privacy№ 1126
t-Closeness
Privacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf.
- privacy№ 317
Differenzielle Privatsphäre
Mathematisches Rahmenwerk, das den Privacy-Verlust bei Statistik-Veröffentlichungen oder Modelltraining quantifiziert und durch kalibriertes Rauschen den Beitrag jeder einzelnen Person beweisbar begrenzt.
- privacy№ 280
Datenminimierung
Datenschutzgrundsatz, der vorschreibt, nur die personenbezogenen Daten zu erheben, zu verarbeiten und aufzubewahren, die für einen definierten, rechtmäßigen Zweck notwendig sind.
● Siehe auch
- № 1164Tokenisierung (Datenschutz)
- № 279Datenmaskierung
- № 1165Tor / Tor Browser
- № 755Onion Routing
- № 503I2P