Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 1126

t-близость

Что такое t-близость?

t-близостьМодель приватности Li, Li и Venkatasubramanian, усиливающая l-разнообразие за счёт ограничения отклонения распределения чувствительного атрибута в классе от его глобального распределения.


Предложенная в 2007 году t-близость нивелирует атаки на l-разнообразие по асимметрии и сходству, требуя, чтобы распределение чувствительного атрибута в каждом классе эквивалентности отличалось от распределения по всему набору не более чем на t (обычно по Earth Mover's Distance). Это не позволяет атакующему вывести значение атрибута, когда класс доминирует семантически близкими, но различными значениями (например, несколькими редкими типами рака). Снижение t обычно требует более сильного обобщения или подавления и ухудшает полезность данных, поэтому выбор t — компромисс между риском и полезностью. t-близость часто применяется поверх k-анонимности и l-разнообразия в медицине, госпубликациях и исследованиях.

Примеры

  1. 01

    Распределение окладов в каждой ячейке "пол/возраст" находится в пределах t=0,2 от глобального распределения.

  2. 02

    Применение t-близости, чтобы ни один класс эквивалентности не был чрезмерно сосредоточен на одном редком заболевании.

Частые вопросы

Что такое t-близость?

Модель приватности Li, Li и Venkatasubramanian, усиливающая l-разнообразие за счёт ограничения отклонения распределения чувствительного атрибута в классе от его глобального распределения. Относится к категории Приватность и защита данных в кибербезопасности.

Что означает t-близость?

Модель приватности Li, Li и Venkatasubramanian, усиливающая l-разнообразие за счёт ограничения отклонения распределения чувствительного атрибута в классе от его глобального распределения.

Как работает t-близость?

Предложенная в 2007 году t-близость нивелирует атаки на l-разнообразие по асимметрии и сходству, требуя, чтобы распределение чувствительного атрибута в каждом классе эквивалентности отличалось от распределения по всему набору не более чем на t (обычно по Earth Mover's Distance). Это не позволяет атакующему вывести значение атрибута, когда класс доминирует семантически близкими, но различными значениями (например, несколькими редкими типами рака). Снижение t обычно требует более сильного обобщения или подавления и ухудшает полезность данных, поэтому выбор t — компромисс между риском и полезностью. t-близость часто применяется поверх k-анонимности и l-разнообразия в медицине, госпубликациях и исследованиях.

Как защититься от t-близость?

Защита от t-близость обычно сочетает технические меры и операционные практики, как описано в определении выше.

Какие есть другие названия t-близость?

Распространённые альтернативные названия: Анонимизация по t-близости.

Связанные термины