Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 576

k-анонимность

Что такое k-анонимность?

k-анонимностьМодель приватности, предложенная Latanya Sweeney, требующая, чтобы каждая запись в наборе данных была неотличима по квази-идентификаторам как минимум от k-1 других записей.


k-анонимность, формализованная Sweeney в 2002 году, защищает от повторной идентификации, гарантируя, что каждая комбинация квази-идентификаторов (возраст, почтовый индекс, пол и т. п.) встречается минимум в k записях, образуя классы эквивалентности. Достигается обобщением (замена точных значений интервалами или укрупнёнными категориями) и подавлением (удаление редких значений), с применением алгоритмов вроде Mondrian или Incognito. Снижая риск атак связывания, k-анонимность не защищает от атак однородности и атак с использованием внешних знаний, если чувствительный атрибут одинаков внутри класса, что и привело к расширениям l-разнообразия и t-близости. Выбор k балансирует полезность данных, аппетит к риску и регуляторные требования рек. 26 GDPR.

Примеры

  1. 01

    Медицинский набор данных обобщён так, что каждое сочетание "возраст/индекс" соответствует не менее пяти пациентам (k=5).

  2. 02

    Обобщение даты рождения до года для удовлетворения k-анонимности при публикации исследовательских данных.

Частые вопросы

Что такое k-анонимность?

Модель приватности, предложенная Latanya Sweeney, требующая, чтобы каждая запись в наборе данных была неотличима по квази-идентификаторам как минимум от k-1 других записей. Относится к категории Приватность и защита данных в кибербезопасности.

Что означает k-анонимность?

Модель приватности, предложенная Latanya Sweeney, требующая, чтобы каждая запись в наборе данных была неотличима по квази-идентификаторам как минимум от k-1 других записей.

Как работает k-анонимность?

k-анонимность, формализованная Sweeney в 2002 году, защищает от повторной идентификации, гарантируя, что каждая комбинация квази-идентификаторов (возраст, почтовый индекс, пол и т. п.) встречается минимум в k записях, образуя классы эквивалентности. Достигается обобщением (замена точных значений интервалами или укрупнёнными категориями) и подавлением (удаление редких значений), с применением алгоритмов вроде Mondrian или Incognito. Снижая риск атак связывания, k-анонимность не защищает от атак однородности и атак с использованием внешних знаний, если чувствительный атрибут одинаков внутри класса, что и привело к расширениям l-разнообразия и t-близости. Выбор k балансирует полезность данных, аппетит к риску и регуляторные требования рек. 26 GDPR.

Как защититься от k-анонимность?

Защита от k-анонимность обычно сочетает технические меры и операционные практики, как описано в определении выше.

Какие есть другие названия k-анонимность?

Распространённые альтернативные названия: k-анонимизация.

Связанные термины