t-близость
Что такое t-близость?
t-близостьМодель приватности Li, Li и Venkatasubramanian, усиливающая l-разнообразие за счёт ограничения отклонения распределения чувствительного атрибута в классе от его глобального распределения.
Предложенная в 2007 году t-близость нивелирует атаки на l-разнообразие по асимметрии и сходству, требуя, чтобы распределение чувствительного атрибута в каждом классе эквивалентности отличалось от распределения по всему набору не более чем на t (обычно по Earth Mover's Distance). Это не позволяет атакующему вывести значение атрибута, когда класс доминирует семантически близкими, но различными значениями (например, несколькими редкими типами рака). Снижение t обычно требует более сильного обобщения или подавления и ухудшает полезность данных, поэтому выбор t — компромисс между риском и полезностью. t-близость часто применяется поверх k-анонимности и l-разнообразия в медицине, госпубликациях и исследованиях.
● Примеры
- 01
Распределение окладов в каждой ячейке "пол/возраст" находится в пределах t=0,2 от глобального распределения.
- 02
Применение t-близости, чтобы ни один класс эквивалентности не был чрезмерно сосредоточен на одном редком заболевании.
● Частые вопросы
Что такое t-близость?
Модель приватности Li, Li и Venkatasubramanian, усиливающая l-разнообразие за счёт ограничения отклонения распределения чувствительного атрибута в классе от его глобального распределения. Относится к категории Приватность и защита данных в кибербезопасности.
Что означает t-близость?
Модель приватности Li, Li и Venkatasubramanian, усиливающая l-разнообразие за счёт ограничения отклонения распределения чувствительного атрибута в классе от его глобального распределения.
Как работает t-близость?
Предложенная в 2007 году t-близость нивелирует атаки на l-разнообразие по асимметрии и сходству, требуя, чтобы распределение чувствительного атрибута в каждом классе эквивалентности отличалось от распределения по всему набору не более чем на t (обычно по Earth Mover's Distance). Это не позволяет атакующему вывести значение атрибута, когда класс доминирует семантически близкими, но различными значениями (например, несколькими редкими типами рака). Снижение t обычно требует более сильного обобщения или подавления и ухудшает полезность данных, поэтому выбор t — компромисс между риском и полезностью. t-близость часто применяется поверх k-анонимности и l-разнообразия в медицине, госпубликациях и исследованиях.
Как защититься от t-близость?
Защита от t-близость обычно сочетает технические меры и операционные практики, как описано в определении выше.
Какие есть другие названия t-близость?
Распространённые альтернативные названия: Анонимизация по t-близости.
● Связанные термины
- privacy№ 576
k-анонимность
Модель приватности, предложенная Latanya Sweeney, требующая, чтобы каждая запись в наборе данных была неотличима по квази-идентификаторам как минимум от k-1 других записей.
- privacy№ 603
l-разнообразие
Расширение k-анонимности, предложенное Machanavajjhala и соавторами, которое требует, чтобы в каждом классе эквивалентности было не менее l хорошо представленных значений каждого чувствительного атрибута.
- privacy№ 274
Анонимизация данных
Необратимое преобразование персональных данных таким образом, чтобы ни один человек не мог быть идентифицирован прямо или косвенно, даже при объединении с другими данными.
- privacy№ 317
Дифференциальная приватность
Математическая модель, количественно оценивающая утечку приватности при публикации статистики или обучении моделей за счёт добавления калиброванного шума, ограничивающего вклад любого индивида.
- privacy№ 875
Псевдонимизация
Метод замены прямых идентификаторов в персональных данных обратимыми алиасами, после чего данные нельзя соотнести с человеком без отдельно хранимой дополнительной информации.
- privacy№ 280
Минимизация данных
Принцип приватности, требующий собирать, обрабатывать и хранить только те персональные данные, которые строго необходимы для заявленной законной цели.