t-Closeness
Was ist t-Closeness?
t-ClosenessPrivacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf.
Die 2007 vorgestellte t-Closeness mindert Schiefe- und Ähnlichkeitsangriffe gegen die l-Diversität, indem die Verteilung des sensiblen Attributs in jeder Äquivalenzklasse höchstens um den Schwellenwert t von der Verteilung des Gesamtdatensatzes abweichen darf, meist gemessen mit der Earth Mover's Distance. So lässt sich verhindern, dass eine Klasse von semantisch nahen, aber unterschiedlichen Werten (z. B. mehrere seltene Krebstypen) dominiert wird und das sensible Attribut ableitbar bleibt. Niedrige t-Werte kosten Datennutzen, da stärker generalisiert oder unterdrückt werden muss; die Wahl von t ist ein Risiko-Nutzen-Abwägung. t-Closeness wird häufig mit k-Anonymität und l-Diversität kombiniert in Gesundheits-, Verwaltungs- und Forschungsveröffentlichungen.
● Beispiele
- 01
Die Gehaltsverteilung in jeder Geschlecht/Alter-Zelle bleibt innerhalb t=0,2 zur Gesamtverteilung.
- 02
Anwendung von t-Closeness, damit keine Äquivalenzklasse unverhältnismäßig stark von einer einzigen seltenen Erkrankung dominiert wird.
● Häufige Fragen
Was ist t-Closeness?
Privacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf. Es gehört zur Kategorie Datenschutz der Cybersicherheit.
Was bedeutet t-Closeness?
Privacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf.
Wie funktioniert t-Closeness?
Die 2007 vorgestellte t-Closeness mindert Schiefe- und Ähnlichkeitsangriffe gegen die l-Diversität, indem die Verteilung des sensiblen Attributs in jeder Äquivalenzklasse höchstens um den Schwellenwert t von der Verteilung des Gesamtdatensatzes abweichen darf, meist gemessen mit der Earth Mover's Distance. So lässt sich verhindern, dass eine Klasse von semantisch nahen, aber unterschiedlichen Werten (z. B. mehrere seltene Krebstypen) dominiert wird und das sensible Attribut ableitbar bleibt. Niedrige t-Werte kosten Datennutzen, da stärker generalisiert oder unterdrückt werden muss; die Wahl von t ist ein Risiko-Nutzen-Abwägung. t-Closeness wird häufig mit k-Anonymität und l-Diversität kombiniert in Gesundheits-, Verwaltungs- und Forschungsveröffentlichungen.
Wie schützt man sich gegen t-Closeness?
Schutzmaßnahmen gegen t-Closeness kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.
Welche anderen Bezeichnungen gibt es für t-Closeness?
Übliche alternative Bezeichnungen: t-Closeness-Anonymisierung.
● Verwandte Begriffe
- privacy№ 576
k-Anonymität
Privacy-Modell von Latanya Sweeney, das verlangt, dass jeder Datensatz anhand seiner Quasi-Identifikatoren von mindestens k-1 anderen Datensätzen ununterscheidbar ist.
- privacy№ 603
l-Diversität
Erweiterung der k-Anonymität von Machanavajjhala et al., die in jeder Äquivalenzklasse mindestens l gut repräsentierte Werte für jedes sensible Attribut verlangt.
- privacy№ 274
Datenanonymisierung
Unwiderrufliche Umwandlung personenbezogener Daten, sodass keine Person mehr direkt oder indirekt – auch nicht durch Verknüpfung mit anderen Informationen – identifizierbar ist.
- privacy№ 317
Differenzielle Privatsphäre
Mathematisches Rahmenwerk, das den Privacy-Verlust bei Statistik-Veröffentlichungen oder Modelltraining quantifiziert und durch kalibriertes Rauschen den Beitrag jeder einzelnen Person beweisbar begrenzt.
- privacy№ 875
Pseudonymisierung
Verfahren, das direkte Identifikatoren in personenbezogenen Daten durch umkehrbare Aliasse ersetzt, sodass die Daten ohne separat verwahrte Zusatzinformationen keiner Person mehr zugeordnet werden können.
- privacy№ 280
Datenminimierung
Datenschutzgrundsatz, der vorschreibt, nur die personenbezogenen Daten zu erheben, zu verarbeiten und aufzubewahren, die für einen definierten, rechtmäßigen Zweck notwendig sind.