Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 1126

t-Closeness

Was ist t-Closeness?

t-ClosenessPrivacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf.


Die 2007 vorgestellte t-Closeness mindert Schiefe- und Ähnlichkeitsangriffe gegen die l-Diversität, indem die Verteilung des sensiblen Attributs in jeder Äquivalenzklasse höchstens um den Schwellenwert t von der Verteilung des Gesamtdatensatzes abweichen darf, meist gemessen mit der Earth Mover's Distance. So lässt sich verhindern, dass eine Klasse von semantisch nahen, aber unterschiedlichen Werten (z. B. mehrere seltene Krebstypen) dominiert wird und das sensible Attribut ableitbar bleibt. Niedrige t-Werte kosten Datennutzen, da stärker generalisiert oder unterdrückt werden muss; die Wahl von t ist ein Risiko-Nutzen-Abwägung. t-Closeness wird häufig mit k-Anonymität und l-Diversität kombiniert in Gesundheits-, Verwaltungs- und Forschungsveröffentlichungen.

Beispiele

  1. 01

    Die Gehaltsverteilung in jeder Geschlecht/Alter-Zelle bleibt innerhalb t=0,2 zur Gesamtverteilung.

  2. 02

    Anwendung von t-Closeness, damit keine Äquivalenzklasse unverhältnismäßig stark von einer einzigen seltenen Erkrankung dominiert wird.

Häufige Fragen

Was ist t-Closeness?

Privacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf. Es gehört zur Kategorie Datenschutz der Cybersicherheit.

Was bedeutet t-Closeness?

Privacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf.

Wie funktioniert t-Closeness?

Die 2007 vorgestellte t-Closeness mindert Schiefe- und Ähnlichkeitsangriffe gegen die l-Diversität, indem die Verteilung des sensiblen Attributs in jeder Äquivalenzklasse höchstens um den Schwellenwert t von der Verteilung des Gesamtdatensatzes abweichen darf, meist gemessen mit der Earth Mover's Distance. So lässt sich verhindern, dass eine Klasse von semantisch nahen, aber unterschiedlichen Werten (z. B. mehrere seltene Krebstypen) dominiert wird und das sensible Attribut ableitbar bleibt. Niedrige t-Werte kosten Datennutzen, da stärker generalisiert oder unterdrückt werden muss; die Wahl von t ist ein Risiko-Nutzen-Abwägung. t-Closeness wird häufig mit k-Anonymität und l-Diversität kombiniert in Gesundheits-, Verwaltungs- und Forschungsveröffentlichungen.

Wie schützt man sich gegen t-Closeness?

Schutzmaßnahmen gegen t-Closeness kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.

Welche anderen Bezeichnungen gibt es für t-Closeness?

Übliche alternative Bezeichnungen: t-Closeness-Anonymisierung.

Verwandte Begriffe