t-proximité
Qu'est-ce que t-proximité ?
t-proximitéModèle de confidentialité de Li, Li et Venkatasubramanian renforçant la l-diversité en limitant l'écart entre la distribution d'un attribut sensible dans chaque classe et sa distribution globale.
La t-proximité, introduite en 2007, atténue les attaques par asymétrie et similarité contre la l-diversité en exigeant que la distribution de l'attribut sensible dans chaque classe d'équivalence reste à une distance maximale t de la distribution dans l'ensemble du jeu, souvent mesurée par l'Earth Mover's Distance. Cela empêche un attaquant de déduire l'attribut sensible lorsqu'une classe est dominée par des valeurs sémantiquement proches mais distinctes (plusieurs cancers rares, par exemple). Obtenir un t faible coûte généralement de l'utilité car davantage de généralisation ou de suppression est nécessaire ; le choix de t répond à un arbitrage risque/utilité. La t-proximité est souvent superposée au k-anonymat et à la l-diversité dans les jeux de données de santé, gouvernementaux et de recherche.
● Exemples
- 01
Veiller à ce que la distribution salariale dans chaque cellule genre/âge reste à t=0,2 de la distribution générale.
- 02
Appliquer la t-proximité pour qu'aucune classe d'équivalence ne soit dominée par une seule maladie rare.
● Questions fréquentes
Qu'est-ce que t-proximité ?
Modèle de confidentialité de Li, Li et Venkatasubramanian renforçant la l-diversité en limitant l'écart entre la distribution d'un attribut sensible dans chaque classe et sa distribution globale. Cette notion relève de la catégorie Confidentialité et protection des données en cybersécurité.
Que signifie t-proximité ?
Modèle de confidentialité de Li, Li et Venkatasubramanian renforçant la l-diversité en limitant l'écart entre la distribution d'un attribut sensible dans chaque classe et sa distribution globale.
Comment fonctionne t-proximité ?
La t-proximité, introduite en 2007, atténue les attaques par asymétrie et similarité contre la l-diversité en exigeant que la distribution de l'attribut sensible dans chaque classe d'équivalence reste à une distance maximale t de la distribution dans l'ensemble du jeu, souvent mesurée par l'Earth Mover's Distance. Cela empêche un attaquant de déduire l'attribut sensible lorsqu'une classe est dominée par des valeurs sémantiquement proches mais distinctes (plusieurs cancers rares, par exemple). Obtenir un t faible coûte généralement de l'utilité car davantage de généralisation ou de suppression est nécessaire ; le choix de t répond à un arbitrage risque/utilité. La t-proximité est souvent superposée au k-anonymat et à la l-diversité dans les jeux de données de santé, gouvernementaux et de recherche.
Comment se défendre contre t-proximité ?
Les défenses contre t-proximité combinent habituellement des contrôles techniques et des pratiques opérationnelles, comme détaillé dans la définition ci-dessus.
Quels sont les autres noms de t-proximité ?
Noms alternatifs courants : Anonymisation par t-proximité.
● Termes liés
- privacy№ 576
k-anonymat
Modèle de confidentialité proposé par Latanya Sweeney exigeant que chaque enregistrement d'un jeu de données soit indistinguable d'au moins k-1 autres sur ses quasi-identifiants.
- privacy№ 603
l-diversité
Extension du k-anonymat proposée par Machanavajjhala et al. exigeant que chaque classe d'équivalence contienne au moins l valeurs bien représentées pour chaque attribut sensible.
- privacy№ 274
Anonymisation des données
Transformation irréversible de données personnelles de sorte qu'aucune personne ne puisse être identifiée, directement ou indirectement, même en croisant d'autres sources.
- privacy№ 317
Confidentialité différentielle
Cadre mathématique qui quantifie la perte de confidentialité lors de la publication de statistiques ou de l'entraînement de modèles, par ajout de bruit calibré bornant de manière prouvable la contribution de chaque individu.
- privacy№ 875
Pseudonymisation
Technique qui remplace les identifiants directs des données personnelles par des alias réversibles, de sorte que les données ne puissent plus être attribuées à une personne sans information supplémentaire conservée séparément.
- privacy№ 280
Minimisation des données
Principe de confidentialité imposant de ne collecter, traiter et conserver que les données personnelles strictement nécessaires à une finalité légitime définie.