Anonimização de dados
O que é Anonimização de dados?
Anonimização de dadosTransformação irreversível de dados pessoais para que nenhuma pessoa possa ser identificada, direta ou indiretamente, mesmo cruzando outras informações disponíveis.
A anonimização remove ou altera identificadores, quase-identificadores e atributos sensíveis de modo a tornar a reidentificação razoavelmente impossível. As técnicas incluem supressão, generalização, perturbação, agregação e aleatorização, frequentemente avaliadas com modelos como k-anonimato, l-diversidade, t-proximidade ou privacidade diferencial. Dados verdadeiramente anónimos ficam fora do âmbito do RGPD (considerando 26), mas o nível é elevado: o EDPB e o CNIL exigem avaliações formais do risco de reidentificação considerando os meios "razoavelmente prováveis" de serem usados, incluindo conjuntos auxiliares. Erros comuns são confiar apenas em hashing, divulgar microdados altamente dimensionais ou tratar dados pseudonimizados como anónimos.
● Exemplos
- 01
Publicar estatísticas de reinternamentos hospitalares agregadas por região e trimestre, suprimindo células com menos de cinco casos.
- 02
Divulgar um conjunto público de mobilidade com trajetórias generalizadas à granularidade bairro-semana.
● Perguntas frequentes
O que é Anonimização de dados?
Transformação irreversível de dados pessoais para que nenhuma pessoa possa ser identificada, direta ou indiretamente, mesmo cruzando outras informações disponíveis. Pertence à categoria Privacidade e proteção de dados da cibersegurança.
O que significa Anonimização de dados?
Transformação irreversível de dados pessoais para que nenhuma pessoa possa ser identificada, direta ou indiretamente, mesmo cruzando outras informações disponíveis.
Como funciona Anonimização de dados?
A anonimização remove ou altera identificadores, quase-identificadores e atributos sensíveis de modo a tornar a reidentificação razoavelmente impossível. As técnicas incluem supressão, generalização, perturbação, agregação e aleatorização, frequentemente avaliadas com modelos como k-anonimato, l-diversidade, t-proximidade ou privacidade diferencial. Dados verdadeiramente anónimos ficam fora do âmbito do RGPD (considerando 26), mas o nível é elevado: o EDPB e o CNIL exigem avaliações formais do risco de reidentificação considerando os meios "razoavelmente prováveis" de serem usados, incluindo conjuntos auxiliares. Erros comuns são confiar apenas em hashing, divulgar microdados altamente dimensionais ou tratar dados pseudonimizados como anónimos.
Como se defender contra Anonimização de dados?
As defesas contra Anonimização de dados costumam combinar controles técnicos e práticas operacionais, conforme detalhado na definição acima.
Quais são outros nomes para Anonimização de dados?
Nomes alternativos comuns: Anonimização, Desidentificação forte.
● Termos relacionados
- privacy№ 875
Pseudonimização
Técnica que substitui os identificadores diretos dos dados pessoais por aliases reversíveis, de modo que os dados deixem de ser atribuíveis a uma pessoa sem informação adicional guardada em separado.
- privacy№ 576
k-Anonimato
Modelo de privacidade proposto por Latanya Sweeney que exige que cada registo de um conjunto de dados seja indistinguível de pelo menos k-1 outros nos seus quase-identificadores.
- privacy№ 603
l-Diversidade
Extensão do k-anonimato proposta por Machanavajjhala et al. que exige que cada classe de equivalência contenha pelo menos l valores bem representados para cada atributo sensível.
- privacy№ 1126
t-Proximidade
Modelo de privacidade de Li, Li e Venkatasubramanian que reforça a l-diversidade limitando a distância entre a distribuição de um atributo sensível em cada classe e a distribuição global.
- privacy№ 317
Privacidade diferencial
Quadro matemático que quantifica a perda de privacidade ao divulgar estatísticas ou treinar modelos, adicionando ruído calibrado de modo que a contribuição de qualquer indivíduo seja provavelmente limitada.
- privacy№ 280
Minimização de dados
Princípio de privacidade que obriga as organizações a recolher, tratar e conservar apenas os dados pessoais estritamente necessários a uma finalidade legítima definida.
● Veja também
- № 1164Tokenização (privacidade)
- № 279Mascaramento de dados
- № 1165Tor / Tor Browser
- № 755Onion Routing
- № 503I2P