Confidentialité différentielle
Qu'est-ce que Confidentialité différentielle ?
Confidentialité différentielleCadre mathématique qui quantifie la perte de confidentialité lors de la publication de statistiques ou de l'entraînement de modèles, par ajout de bruit calibré bornant de manière prouvable la contribution de chaque individu.
La confidentialité différentielle, formalisée par Dwork, McSherry, Nissim et Smith, garantit que la probabilité de toute sortie varie au plus d'un facteur e^epsilon (et éventuellement delta) lorsqu'un enregistrement est ajouté ou retiré du jeu de données. Ses mécanismes incluent Laplace, Gauss, exponentiel, ainsi que DP-SGD pour l'apprentissage automatique. La perte cumulée est suivie par un budget de confidentialité (epsilon-delta) et des techniques de composition avancée ou un moments accountant. Le Bureau du recensement américain (2020), Apple, Google et Microsoft l'ont déployée pour la télémétrie et les statistiques. Contrairement aux modèles syntaxiques (k-anonymat, l-diversité), elle offre des garanties prouvables, indépendantes du savoir auxiliaire de l'attaquant.
● Exemples
- 01
Apple remonte la fréquence d'emojis du clavier via une confidentialité différentielle locale.
- 02
Entraîner un modèle médical avec DP-SGD pour qu'aucun dossier patient ne soit mémorisé.
● Questions fréquentes
Qu'est-ce que Confidentialité différentielle ?
Cadre mathématique qui quantifie la perte de confidentialité lors de la publication de statistiques ou de l'entraînement de modèles, par ajout de bruit calibré bornant de manière prouvable la contribution de chaque individu. Cette notion relève de la catégorie Confidentialité et protection des données en cybersécurité.
Que signifie Confidentialité différentielle ?
Cadre mathématique qui quantifie la perte de confidentialité lors de la publication de statistiques ou de l'entraînement de modèles, par ajout de bruit calibré bornant de manière prouvable la contribution de chaque individu.
Comment fonctionne Confidentialité différentielle ?
La confidentialité différentielle, formalisée par Dwork, McSherry, Nissim et Smith, garantit que la probabilité de toute sortie varie au plus d'un facteur e^epsilon (et éventuellement delta) lorsqu'un enregistrement est ajouté ou retiré du jeu de données. Ses mécanismes incluent Laplace, Gauss, exponentiel, ainsi que DP-SGD pour l'apprentissage automatique. La perte cumulée est suivie par un budget de confidentialité (epsilon-delta) et des techniques de composition avancée ou un moments accountant. Le Bureau du recensement américain (2020), Apple, Google et Microsoft l'ont déployée pour la télémétrie et les statistiques. Contrairement aux modèles syntaxiques (k-anonymat, l-diversité), elle offre des garanties prouvables, indépendantes du savoir auxiliaire de l'attaquant.
Comment se défendre contre Confidentialité différentielle ?
Les défenses contre Confidentialité différentielle combinent habituellement des contrôles techniques et des pratiques opérationnelles, comme détaillé dans la définition ci-dessus.
Quels sont les autres noms de Confidentialité différentielle ?
Noms alternatifs courants : DP, Confidentialité différentielle epsilon.
● Termes liés
- privacy№ 274
Anonymisation des données
Transformation irréversible de données personnelles de sorte qu'aucune personne ne puisse être identifiée, directement ou indirectement, même en croisant d'autres sources.
- privacy№ 576
k-anonymat
Modèle de confidentialité proposé par Latanya Sweeney exigeant que chaque enregistrement d'un jeu de données soit indistinguable d'au moins k-1 autres sur ses quasi-identifiants.
- privacy№ 603
l-diversité
Extension du k-anonymat proposée par Machanavajjhala et al. exigeant que chaque classe d'équivalence contienne au moins l valeurs bien représentées pour chaque attribut sensible.
- privacy№ 1126
t-proximité
Modèle de confidentialité de Li, Li et Venkatasubramanian renforçant la l-diversité en limitant l'écart entre la distribution d'un attribut sensible dans chaque classe et sa distribution globale.
- privacy№ 875
Pseudonymisation
Technique qui remplace les identifiants directs des données personnelles par des alias réversibles, de sorte que les données ne puissent plus être attribuées à une personne sans information supplémentaire conservée séparément.
- privacy№ 280
Minimisation des données
Principe de confidentialité imposant de ne collecter, traiter et conserver que les données personnelles strictement nécessaires à une finalité légitime définie.