Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 274

データ匿名化

データ匿名化 とは何ですか?

データ匿名化他の利用可能な情報と組み合わせても直接的・間接的に個人を識別できないよう、個人データを不可逆に変換する処理。


データ匿名化では、識別子・準識別子・機微属性を削除または変換し、再識別を合理的に不可能な水準まで低減します。代表的な手法には抑制(suppression)、一般化、摂動、集計、ランダム化があり、k-匿名性、l-多様性、t-近接性、差分プライバシーなどのプライバシーモデルで評価されます。真に匿名化されたデータは GDPR の適用外(前文 26)とされますが、要求水準は高く、EDPB や CNIL は補助データの利用を含む「合理的に可能な手段」を考慮した形式的な再識別リスク評価を求めています。ハッシュ化のみへの依存、高次元マイクロデータの公開、仮名化データを匿名と扱うことは典型的な落とし穴です。

  1. 01

    病院の再入院統計を地域・四半期で集計し、5 件未満のセルを抑制して公開する。

  2. 02

    公共のモビリティデータを「街区×週」の粒度に一般化して公開する。

よくある質問

データ匿名化 とは何ですか?

他の利用可能な情報と組み合わせても直接的・間接的に個人を識別できないよう、個人データを不可逆に変換する処理。 サイバーセキュリティの プライバシーとデータ保護 カテゴリに属します。

データ匿名化 とはどういう意味ですか?

他の利用可能な情報と組み合わせても直接的・間接的に個人を識別できないよう、個人データを不可逆に変換する処理。

データ匿名化 はどのように機能しますか?

データ匿名化では、識別子・準識別子・機微属性を削除または変換し、再識別を合理的に不可能な水準まで低減します。代表的な手法には抑制(suppression)、一般化、摂動、集計、ランダム化があり、k-匿名性、l-多様性、t-近接性、差分プライバシーなどのプライバシーモデルで評価されます。真に匿名化されたデータは GDPR の適用外(前文 26)とされますが、要求水準は高く、EDPB や CNIL は補助データの利用を含む「合理的に可能な手段」を考慮した形式的な再識別リスク評価を求めています。ハッシュ化のみへの依存、高次元マイクロデータの公開、仮名化データを匿名と扱うことは典型的な落とし穴です。

データ匿名化 からどのように防御しますか?

データ匿名化 に対する防御は通常、上記の定義で述べたとおり、技術的統制と運用上の実践を組み合わせます。

データ匿名化 の別名は何ですか?

一般的な別名: 匿名化, 強い非識別化。

関連用語

関連項目