Differenzielle Privatsphäre
Was ist Differenzielle Privatsphäre?
Differenzielle PrivatsphäreMathematisches Rahmenwerk, das den Privacy-Verlust bei Statistik-Veröffentlichungen oder Modelltraining quantifiziert und durch kalibriertes Rauschen den Beitrag jeder einzelnen Person beweisbar begrenzt.
Differential Privacy, formalisiert von Dwork, McSherry, Nissim und Smith, garantiert, dass sich die Wahrscheinlichkeit eines beliebigen Ergebnisses höchstens um den Faktor e^epsilon (und optional delta) ändert, wenn ein Datensatz hinzugefügt oder entfernt wird. Mechanismen sind Laplace, Gauß, exponentielle sowie DP-SGD für maschinelles Lernen. Der kumulierte Verlust wird über ein Privacy-Budget (Epsilon-Delta) und Verfahren wie advanced composition oder den moments accountant verwaltet. Das US Census Bureau (Zensus 2020), Apple, Google und Microsoft setzen es für Telemetrie und Statistiken ein. Anders als syntaktische Modelle (k-Anonymität, l-Diversität) bietet es nachweisbare, zukunftssichere Garantien unabhängig vom Vorwissen des Angreifers.
● Beispiele
- 01
Apple meldet Tastatur-Emoji-Häufigkeiten über lokale Differential Privacy.
- 02
Training eines medizinischen Modells mit DP-SGD, damit Patientendaten nicht memorisiert werden.
● Häufige Fragen
Was ist Differenzielle Privatsphäre?
Mathematisches Rahmenwerk, das den Privacy-Verlust bei Statistik-Veröffentlichungen oder Modelltraining quantifiziert und durch kalibriertes Rauschen den Beitrag jeder einzelnen Person beweisbar begrenzt. Es gehört zur Kategorie Datenschutz der Cybersicherheit.
Was bedeutet Differenzielle Privatsphäre?
Mathematisches Rahmenwerk, das den Privacy-Verlust bei Statistik-Veröffentlichungen oder Modelltraining quantifiziert und durch kalibriertes Rauschen den Beitrag jeder einzelnen Person beweisbar begrenzt.
Wie funktioniert Differenzielle Privatsphäre?
Differential Privacy, formalisiert von Dwork, McSherry, Nissim und Smith, garantiert, dass sich die Wahrscheinlichkeit eines beliebigen Ergebnisses höchstens um den Faktor e^epsilon (und optional delta) ändert, wenn ein Datensatz hinzugefügt oder entfernt wird. Mechanismen sind Laplace, Gauß, exponentielle sowie DP-SGD für maschinelles Lernen. Der kumulierte Verlust wird über ein Privacy-Budget (Epsilon-Delta) und Verfahren wie advanced composition oder den moments accountant verwaltet. Das US Census Bureau (Zensus 2020), Apple, Google und Microsoft setzen es für Telemetrie und Statistiken ein. Anders als syntaktische Modelle (k-Anonymität, l-Diversität) bietet es nachweisbare, zukunftssichere Garantien unabhängig vom Vorwissen des Angreifers.
Wie schützt man sich gegen Differenzielle Privatsphäre?
Schutzmaßnahmen gegen Differenzielle Privatsphäre kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.
Welche anderen Bezeichnungen gibt es für Differenzielle Privatsphäre?
Übliche alternative Bezeichnungen: DP, Epsilon-Differential-Privacy.
● Verwandte Begriffe
- privacy№ 274
Datenanonymisierung
Unwiderrufliche Umwandlung personenbezogener Daten, sodass keine Person mehr direkt oder indirekt – auch nicht durch Verknüpfung mit anderen Informationen – identifizierbar ist.
- privacy№ 576
k-Anonymität
Privacy-Modell von Latanya Sweeney, das verlangt, dass jeder Datensatz anhand seiner Quasi-Identifikatoren von mindestens k-1 anderen Datensätzen ununterscheidbar ist.
- privacy№ 603
l-Diversität
Erweiterung der k-Anonymität von Machanavajjhala et al., die in jeder Äquivalenzklasse mindestens l gut repräsentierte Werte für jedes sensible Attribut verlangt.
- privacy№ 1126
t-Closeness
Privacy-Modell von Li, Li und Venkatasubramanian, das die l-Diversität verstärkt, indem es begrenzt, wie stark sich die Verteilung eines sensiblen Attributs in einer Klasse von der globalen Verteilung unterscheiden darf.
- privacy№ 875
Pseudonymisierung
Verfahren, das direkte Identifikatoren in personenbezogenen Daten durch umkehrbare Aliasse ersetzt, sodass die Daten ohne separat verwahrte Zusatzinformationen keiner Person mehr zugeordnet werden können.
- privacy№ 280
Datenminimierung
Datenschutzgrundsatz, der vorschreibt, nur die personenbezogenen Daten zu erheben, zu verarbeiten und aufzubewahren, die für einen definierten, rechtmäßigen Zweck notwendig sind.