k-Anonimidad
¿Qué es k-Anonimidad?
k-AnonimidadModelo de privacidad propuesto por Latanya Sweeney que exige que cada registro de un conjunto sea indistinguible de al menos k-1 más según sus cuasi-identificadores.
La k-anonimidad, formalizada por Sweeney en 2002, protege frente a la reidentificación garantizando que cada combinación de cuasi-identificadores (edad, código postal, sexo, etc.) aparezca en al menos k registros, formando clases de equivalencia. Se logra mediante generalización (sustituir valores exactos por rangos o categorías) y supresión (eliminar valores poco frecuentes), con algoritmos como Mondrian o Incognito. Aunque reduce los ataques por enlace, no protege frente a ataques de homogeneidad ni de conocimiento previo si el atributo sensible es idéntico dentro de una clase, lo que motivó las extensiones de l-diversidad y t-cercanía. La elección de k responde a un compromiso entre utilidad, apetito de riesgo y expectativas regulatorias bajo el considerando 26 del RGPD.
● Ejemplos
- 01
Un conjunto médico generalizado de modo que cada combinación edad/código postal coincida con al menos cinco pacientes (k=5).
- 02
Generalizar la fecha de nacimiento al año para cumplir la k-anonimidad en una publicación pública de investigación.
● Preguntas frecuentes
¿Qué es k-Anonimidad?
Modelo de privacidad propuesto por Latanya Sweeney que exige que cada registro de un conjunto sea indistinguible de al menos k-1 más según sus cuasi-identificadores. Pertenece a la categoría de Privacidad y protección de datos en ciberseguridad.
¿Qué significa k-Anonimidad?
Modelo de privacidad propuesto por Latanya Sweeney que exige que cada registro de un conjunto sea indistinguible de al menos k-1 más según sus cuasi-identificadores.
¿Cómo funciona k-Anonimidad?
La k-anonimidad, formalizada por Sweeney en 2002, protege frente a la reidentificación garantizando que cada combinación de cuasi-identificadores (edad, código postal, sexo, etc.) aparezca en al menos k registros, formando clases de equivalencia. Se logra mediante generalización (sustituir valores exactos por rangos o categorías) y supresión (eliminar valores poco frecuentes), con algoritmos como Mondrian o Incognito. Aunque reduce los ataques por enlace, no protege frente a ataques de homogeneidad ni de conocimiento previo si el atributo sensible es idéntico dentro de una clase, lo que motivó las extensiones de l-diversidad y t-cercanía. La elección de k responde a un compromiso entre utilidad, apetito de riesgo y expectativas regulatorias bajo el considerando 26 del RGPD.
¿Cómo defenderse de k-Anonimidad?
Las defensas contra k-Anonimidad combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para k-Anonimidad?
Nombres alternativos comunes: k-anonimización.
● Términos relacionados
- privacy№ 274
Anonimización de datos
Transformación irreversible de datos personales para que nadie pueda ser identificado, directa o indirectamente, ni siquiera al combinarlos con otra información disponible.
- privacy№ 603
l-Diversidad
Extensión de la k-anonimidad propuesta por Machanavajjhala et al. que exige que cada clase de equivalencia contenga al menos l valores bien representados para cada atributo sensible.
- privacy№ 1126
t-Cercanía
Modelo de privacidad de Li, Li y Venkatasubramanian que refuerza la l-diversidad limitando cuánto puede diferir la distribución de un atributo sensible en cada clase respecto a la distribución global.
- privacy№ 317
Privacidad diferencial
Marco matemático que cuantifica la pérdida de privacidad al publicar estadísticas o entrenar modelos, añadiendo ruido calibrado para acotar de forma demostrable la influencia de cualquier individuo.
- privacy№ 875
Seudonimización
Técnica que sustituye los identificadores directos de los datos personales por alias reversibles, de modo que dejen de poder atribuirse a una persona sin información adicional guardada por separado.
- privacy№ 818
Información de Identificación Personal (PII)
Cualquier dato que permita identificar a una persona específica por sí solo o combinado con otra información, como nombres, identificadores o registros biométricos.