Anonimización de datos
¿Qué es Anonimización de datos?
Anonimización de datosTransformación irreversible de datos personales para que nadie pueda ser identificado, directa o indirectamente, ni siquiera al combinarlos con otra información disponible.
La anonimización de datos elimina o altera identificadores, cuasi-identificadores y atributos sensibles de modo que la reidentificación deje de ser razonablemente posible. Las técnicas incluyen supresión, generalización, perturbación, agregación y aleatorización, evaluadas con modelos como k-anonimidad, l-diversidad, t-cercanía o privacidad diferencial. Los datos verdaderamente anónimos quedan fuera del alcance del RGPD (considerando 26), pero el listón es alto: autoridades como el EDPB y la CNIL exigen evaluaciones formales del riesgo de reidentificación considerando los medios "razonablemente probables", incluidos conjuntos auxiliares. Errores frecuentes son apoyarse solo en hashing, publicar microdatos de alta dimensionalidad o tratar como anónimos datos meramente seudonimizados.
● Ejemplos
- 01
Publicar estadísticas de reingresos hospitalarios agregadas por región y trimestre, suprimiendo celdas con menos de cinco casos.
- 02
Liberar un conjunto público de movilidad con trayectorias generalizadas a granularidad de barrio y semana.
● Preguntas frecuentes
¿Qué es Anonimización de datos?
Transformación irreversible de datos personales para que nadie pueda ser identificado, directa o indirectamente, ni siquiera al combinarlos con otra información disponible. Pertenece a la categoría de Privacidad y protección de datos en ciberseguridad.
¿Qué significa Anonimización de datos?
Transformación irreversible de datos personales para que nadie pueda ser identificado, directa o indirectamente, ni siquiera al combinarlos con otra información disponible.
¿Cómo funciona Anonimización de datos?
La anonimización de datos elimina o altera identificadores, cuasi-identificadores y atributos sensibles de modo que la reidentificación deje de ser razonablemente posible. Las técnicas incluyen supresión, generalización, perturbación, agregación y aleatorización, evaluadas con modelos como k-anonimidad, l-diversidad, t-cercanía o privacidad diferencial. Los datos verdaderamente anónimos quedan fuera del alcance del RGPD (considerando 26), pero el listón es alto: autoridades como el EDPB y la CNIL exigen evaluaciones formales del riesgo de reidentificación considerando los medios "razonablemente probables", incluidos conjuntos auxiliares. Errores frecuentes son apoyarse solo en hashing, publicar microdatos de alta dimensionalidad o tratar como anónimos datos meramente seudonimizados.
¿Cómo defenderse de Anonimización de datos?
Las defensas contra Anonimización de datos combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para Anonimización de datos?
Nombres alternativos comunes: Anonimización, De-identificación fuerte.
● Términos relacionados
- privacy№ 875
Seudonimización
Técnica que sustituye los identificadores directos de los datos personales por alias reversibles, de modo que dejen de poder atribuirse a una persona sin información adicional guardada por separado.
- privacy№ 576
k-Anonimidad
Modelo de privacidad propuesto por Latanya Sweeney que exige que cada registro de un conjunto sea indistinguible de al menos k-1 más según sus cuasi-identificadores.
- privacy№ 603
l-Diversidad
Extensión de la k-anonimidad propuesta por Machanavajjhala et al. que exige que cada clase de equivalencia contenga al menos l valores bien representados para cada atributo sensible.
- privacy№ 1126
t-Cercanía
Modelo de privacidad de Li, Li y Venkatasubramanian que refuerza la l-diversidad limitando cuánto puede diferir la distribución de un atributo sensible en cada clase respecto a la distribución global.
- privacy№ 317
Privacidad diferencial
Marco matemático que cuantifica la pérdida de privacidad al publicar estadísticas o entrenar modelos, añadiendo ruido calibrado para acotar de forma demostrable la influencia de cualquier individuo.
- privacy№ 280
Minimización de datos
Principio de privacidad que obliga a recoger, tratar y conservar únicamente los datos personales estrictamente necesarios para una finalidad legítima definida.
● Véase también
- № 1164Tokenización (privacidad)
- № 279Enmascaramiento de datos
- № 1165Tor / Tor Browser
- № 755Onion Routing
- № 503I2P