t-Cercanía
¿Qué es t-Cercanía?
t-CercaníaModelo de privacidad de Li, Li y Venkatasubramanian que refuerza la l-diversidad limitando cuánto puede diferir la distribución de un atributo sensible en cada clase respecto a la distribución global.
La t-cercanía, presentada en 2007, mitiga ataques por sesgo y similitud propios de la l-diversidad exigiendo que la distribución del atributo sensible en cada clase de equivalencia se mantenga dentro de un umbral t respecto a la distribución del conjunto completo, normalmente medido mediante la Earth Mover's Distance. Así se evita que un adversario infiera el valor sensible cuando una clase está dominada por valores semánticamente cercanos aunque distintos (por ejemplo varios tipos raros de cáncer). Conseguir un t bajo suele reducir la utilidad porque exige más generalización o supresión, por lo que la elección de t responde a un compromiso entre riesgo y utilidad. Suele aplicarse sobre k-anonimidad y l-diversidad en datos sanitarios, gubernamentales y de investigación.
● Ejemplos
- 01
Garantizar que la distribución salarial en cada celda género/edad esté a una distancia t=0,2 de la distribución global.
- 02
Aplicar t-cercanía para que ninguna clase de equivalencia concentre desproporcionadamente una sola enfermedad rara.
● Preguntas frecuentes
¿Qué es t-Cercanía?
Modelo de privacidad de Li, Li y Venkatasubramanian que refuerza la l-diversidad limitando cuánto puede diferir la distribución de un atributo sensible en cada clase respecto a la distribución global. Pertenece a la categoría de Privacidad y protección de datos en ciberseguridad.
¿Qué significa t-Cercanía?
Modelo de privacidad de Li, Li y Venkatasubramanian que refuerza la l-diversidad limitando cuánto puede diferir la distribución de un atributo sensible en cada clase respecto a la distribución global.
¿Cómo funciona t-Cercanía?
La t-cercanía, presentada en 2007, mitiga ataques por sesgo y similitud propios de la l-diversidad exigiendo que la distribución del atributo sensible en cada clase de equivalencia se mantenga dentro de un umbral t respecto a la distribución del conjunto completo, normalmente medido mediante la Earth Mover's Distance. Así se evita que un adversario infiera el valor sensible cuando una clase está dominada por valores semánticamente cercanos aunque distintos (por ejemplo varios tipos raros de cáncer). Conseguir un t bajo suele reducir la utilidad porque exige más generalización o supresión, por lo que la elección de t responde a un compromiso entre riesgo y utilidad. Suele aplicarse sobre k-anonimidad y l-diversidad en datos sanitarios, gubernamentales y de investigación.
¿Cómo defenderse de t-Cercanía?
Las defensas contra t-Cercanía combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para t-Cercanía?
Nombres alternativos comunes: Anonimización por t-cercanía.
● Términos relacionados
- privacy№ 576
k-Anonimidad
Modelo de privacidad propuesto por Latanya Sweeney que exige que cada registro de un conjunto sea indistinguible de al menos k-1 más según sus cuasi-identificadores.
- privacy№ 603
l-Diversidad
Extensión de la k-anonimidad propuesta por Machanavajjhala et al. que exige que cada clase de equivalencia contenga al menos l valores bien representados para cada atributo sensible.
- privacy№ 274
Anonimización de datos
Transformación irreversible de datos personales para que nadie pueda ser identificado, directa o indirectamente, ni siquiera al combinarlos con otra información disponible.
- privacy№ 317
Privacidad diferencial
Marco matemático que cuantifica la pérdida de privacidad al publicar estadísticas o entrenar modelos, añadiendo ruido calibrado para acotar de forma demostrable la influencia de cualquier individuo.
- privacy№ 875
Seudonimización
Técnica que sustituye los identificadores directos de los datos personales por alias reversibles, de modo que dejen de poder atribuirse a una persona sin información adicional guardada por separado.
- privacy№ 280
Minimización de datos
Principio de privacidad que obliga a recoger, tratar y conservar únicamente los datos personales estrictamente necesarios para una finalidad legítima definida.