Анонимизация данных
Что такое Анонимизация данных?
Анонимизация данныхНеобратимое преобразование персональных данных таким образом, чтобы ни один человек не мог быть идентифицирован прямо или косвенно, даже при объединении с другими данными.
Анонимизация удаляет или изменяет идентификаторы, квази-идентификаторы и чувствительные атрибуты так, чтобы повторная идентификация становилась практически невозможной. Используются подавление, обобщение, возмущение, агрегация и рандомизация, оцениваемые по моделям k-анонимности, l-разнообразия, t-близости или дифференциальной приватности. Подлинно анонимные данные выходят из-под действия GDPR (рек. 26), однако планка высока: EDPB и CNIL требуют формальной оценки риска повторной идентификации с учётом "разумно вероятных" средств, включая вспомогательные наборы. Типичные ошибки — опора только на хеширование, публикация многомерных микроданных и приравнивание псевдонимизированных данных к анонимным.
● Примеры
- 01
Публикация статистики повторных госпитализаций по регионам и кварталам с подавлением ячеек, где менее пяти случаев.
- 02
Публикация набора данных о перемещениях, в котором траектории обобщены до уровня "район — неделя".
● Частые вопросы
Что такое Анонимизация данных?
Необратимое преобразование персональных данных таким образом, чтобы ни один человек не мог быть идентифицирован прямо или косвенно, даже при объединении с другими данными. Относится к категории Приватность и защита данных в кибербезопасности.
Что означает Анонимизация данных?
Необратимое преобразование персональных данных таким образом, чтобы ни один человек не мог быть идентифицирован прямо или косвенно, даже при объединении с другими данными.
Как работает Анонимизация данных?
Анонимизация удаляет или изменяет идентификаторы, квази-идентификаторы и чувствительные атрибуты так, чтобы повторная идентификация становилась практически невозможной. Используются подавление, обобщение, возмущение, агрегация и рандомизация, оцениваемые по моделям k-анонимности, l-разнообразия, t-близости или дифференциальной приватности. Подлинно анонимные данные выходят из-под действия GDPR (рек. 26), однако планка высока: EDPB и CNIL требуют формальной оценки риска повторной идентификации с учётом "разумно вероятных" средств, включая вспомогательные наборы. Типичные ошибки — опора только на хеширование, публикация многомерных микроданных и приравнивание псевдонимизированных данных к анонимным.
Как защититься от Анонимизация данных?
Защита от Анонимизация данных обычно сочетает технические меры и операционные практики, как описано в определении выше.
Какие есть другие названия Анонимизация данных?
Распространённые альтернативные названия: Обезличивание, Сильное деидентифицирование.
● Связанные термины
- privacy№ 875
Псевдонимизация
Метод замены прямых идентификаторов в персональных данных обратимыми алиасами, после чего данные нельзя соотнести с человеком без отдельно хранимой дополнительной информации.
- privacy№ 576
k-анонимность
Модель приватности, предложенная Latanya Sweeney, требующая, чтобы каждая запись в наборе данных была неотличима по квази-идентификаторам как минимум от k-1 других записей.
- privacy№ 603
l-разнообразие
Расширение k-анонимности, предложенное Machanavajjhala и соавторами, которое требует, чтобы в каждом классе эквивалентности было не менее l хорошо представленных значений каждого чувствительного атрибута.
- privacy№ 1126
t-близость
Модель приватности Li, Li и Venkatasubramanian, усиливающая l-разнообразие за счёт ограничения отклонения распределения чувствительного атрибута в классе от его глобального распределения.
- privacy№ 317
Дифференциальная приватность
Математическая модель, количественно оценивающая утечку приватности при публикации статистики или обучении моделей за счёт добавления калиброванного шума, ограничивающего вклад любого индивида.
- privacy№ 280
Минимизация данных
Принцип приватности, требующий собирать, обрабатывать и хранить только те персональные данные, которые строго необходимы для заявленной законной цели.
● См. также
- № 1164Токенизация (приватность)
- № 279Маскирование данных
- № 1165Tor / Tor Browser
- № 755Onion Routing
- № 503I2P