l-diversité
Qu'est-ce que l-diversité ?
l-diversitéExtension du k-anonymat proposée par Machanavajjhala et al. exigeant que chaque classe d'équivalence contienne au moins l valeurs bien représentées pour chaque attribut sensible.
La l-diversité, proposée en 2007, corrige deux faiblesses du k-anonymat : les attaques d'homogénéité (lorsque tous les enregistrements d'une classe partagent la même valeur sensible) et les attaques par connaissance contextuelle. En imposant l valeurs distinctes et bien représentées des attributs sensibles dans chaque classe, l'attaquant ne peut déterminer la valeur sensible même après avoir restreint la cible à une classe. Les variantes incluent la l-diversité distincte, par entropie et la (c, l)-diversité récursive, équilibrant solidité et perte d'information. Elle se combine souvent avec le k-anonymat et la t-proximité dans des publications respectueuses de la vie privée, et est implémentée dans ARX, sdcMicro ou Amnesia pour les jeux de données sanitaires, recensements et enquêtes.
● Exemples
- 01
Veiller à ce que chaque groupe âge/code postal de patients comporte au moins trois diagnostics distincts avant publication.
- 02
Appliquer une l-diversité par entropie à un jeu de salaires pour qu'aucune classe ne soit dominée par une seule tranche de revenus.
● Questions fréquentes
Qu'est-ce que l-diversité ?
Extension du k-anonymat proposée par Machanavajjhala et al. exigeant que chaque classe d'équivalence contienne au moins l valeurs bien représentées pour chaque attribut sensible. Cette notion relève de la catégorie Confidentialité et protection des données en cybersécurité.
Que signifie l-diversité ?
Extension du k-anonymat proposée par Machanavajjhala et al. exigeant que chaque classe d'équivalence contienne au moins l valeurs bien représentées pour chaque attribut sensible.
Comment fonctionne l-diversité ?
La l-diversité, proposée en 2007, corrige deux faiblesses du k-anonymat : les attaques d'homogénéité (lorsque tous les enregistrements d'une classe partagent la même valeur sensible) et les attaques par connaissance contextuelle. En imposant l valeurs distinctes et bien représentées des attributs sensibles dans chaque classe, l'attaquant ne peut déterminer la valeur sensible même après avoir restreint la cible à une classe. Les variantes incluent la l-diversité distincte, par entropie et la (c, l)-diversité récursive, équilibrant solidité et perte d'information. Elle se combine souvent avec le k-anonymat et la t-proximité dans des publications respectueuses de la vie privée, et est implémentée dans ARX, sdcMicro ou Amnesia pour les jeux de données sanitaires, recensements et enquêtes.
Comment se défendre contre l-diversité ?
Les défenses contre l-diversité combinent habituellement des contrôles techniques et des pratiques opérationnelles, comme détaillé dans la définition ci-dessus.
Quels sont les autres noms de l-diversité ?
Noms alternatifs courants : k-anonymat l-divers.
● Termes liés
- privacy№ 576
k-anonymat
Modèle de confidentialité proposé par Latanya Sweeney exigeant que chaque enregistrement d'un jeu de données soit indistinguable d'au moins k-1 autres sur ses quasi-identifiants.
- privacy№ 1126
t-proximité
Modèle de confidentialité de Li, Li et Venkatasubramanian renforçant la l-diversité en limitant l'écart entre la distribution d'un attribut sensible dans chaque classe et sa distribution globale.
- privacy№ 274
Anonymisation des données
Transformation irréversible de données personnelles de sorte qu'aucune personne ne puisse être identifiée, directement ou indirectement, même en croisant d'autres sources.
- privacy№ 317
Confidentialité différentielle
Cadre mathématique qui quantifie la perte de confidentialité lors de la publication de statistiques ou de l'entraînement de modèles, par ajout de bruit calibré bornant de manière prouvable la contribution de chaque individu.
- privacy№ 875
Pseudonymisation
Technique qui remplace les identifiants directs des données personnelles par des alias réversibles, de sorte que les données ne puissent plus être attribuées à une personne sans information supplémentaire conservée séparément.
- privacy№ 280
Minimisation des données
Principe de confidentialité imposant de ne collecter, traiter et conserver que les données personnelles strictement nécessaires à une finalité légitime définie.