k-Anonimato
O que é k-Anonimato?
k-AnonimatoModelo de privacidade proposto por Latanya Sweeney que exige que cada registo de um conjunto de dados seja indistinguível de pelo menos k-1 outros nos seus quase-identificadores.
O k-anonimato, formalizado por Sweeney em 2002, protege contra a reidentificação garantindo que cada combinação de quase-identificadores (idade, código postal, género...) ocorre em pelo menos k registos, formando classes de equivalência. Obtém-se por generalização (substituir valores exatos por intervalos ou categorias mais amplas) e supressão (remover valores raros), com algoritmos como Mondrian ou Incognito. Embora reduza ataques de ligação, não protege contra ataques de homogeneidade ou de conhecimento prévio quando o atributo sensível é igual dentro de uma classe, motivando extensões como l-diversidade e t-proximidade. Na prática, k equilibra utilidade dos dados, apetite de risco e expectativas regulatórias do considerando 26 do RGPD.
● Exemplos
- 01
Um conjunto médico generalizado para que cada combinação idade/código postal corresponda a pelo menos cinco doentes (k=5).
- 02
Generalizar a data de nascimento para o ano de forma a cumprir o k-anonimato numa divulgação pública de investigação.
● Perguntas frequentes
O que é k-Anonimato?
Modelo de privacidade proposto por Latanya Sweeney que exige que cada registo de um conjunto de dados seja indistinguível de pelo menos k-1 outros nos seus quase-identificadores. Pertence à categoria Privacidade e proteção de dados da cibersegurança.
O que significa k-Anonimato?
Modelo de privacidade proposto por Latanya Sweeney que exige que cada registo de um conjunto de dados seja indistinguível de pelo menos k-1 outros nos seus quase-identificadores.
Como funciona k-Anonimato?
O k-anonimato, formalizado por Sweeney em 2002, protege contra a reidentificação garantindo que cada combinação de quase-identificadores (idade, código postal, género...) ocorre em pelo menos k registos, formando classes de equivalência. Obtém-se por generalização (substituir valores exatos por intervalos ou categorias mais amplas) e supressão (remover valores raros), com algoritmos como Mondrian ou Incognito. Embora reduza ataques de ligação, não protege contra ataques de homogeneidade ou de conhecimento prévio quando o atributo sensível é igual dentro de uma classe, motivando extensões como l-diversidade e t-proximidade. Na prática, k equilibra utilidade dos dados, apetite de risco e expectativas regulatórias do considerando 26 do RGPD.
Como se defender contra k-Anonimato?
As defesas contra k-Anonimato costumam combinar controles técnicos e práticas operacionais, conforme detalhado na definição acima.
Quais são outros nomes para k-Anonimato?
Nomes alternativos comuns: k-anonimização.
● Termos relacionados
- privacy№ 274
Anonimização de dados
Transformação irreversível de dados pessoais para que nenhuma pessoa possa ser identificada, direta ou indiretamente, mesmo cruzando outras informações disponíveis.
- privacy№ 603
l-Diversidade
Extensão do k-anonimato proposta por Machanavajjhala et al. que exige que cada classe de equivalência contenha pelo menos l valores bem representados para cada atributo sensível.
- privacy№ 1126
t-Proximidade
Modelo de privacidade de Li, Li e Venkatasubramanian que reforça a l-diversidade limitando a distância entre a distribuição de um atributo sensível em cada classe e a distribuição global.
- privacy№ 317
Privacidade diferencial
Quadro matemático que quantifica a perda de privacidade ao divulgar estatísticas ou treinar modelos, adicionando ruído calibrado de modo que a contribuição de qualquer indivíduo seja provavelmente limitada.
- privacy№ 875
Pseudonimização
Técnica que substitui os identificadores diretos dos dados pessoais por aliases reversíveis, de modo que os dados deixem de ser atribuíveis a uma pessoa sem informação adicional guardada em separado.
- privacy№ 818
Informações de Identificação Pessoal (PII)
Qualquer dado que permita identificar uma pessoa específica, isoladamente ou em conjunto com outras informações, como nomes, identificadores ou registos biométricos.