Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 576

k-匿名性

k-匿名性 とは何ですか?

k-匿名性Latanya Sweeney が提唱したプライバシーモデルで、データセット内の各レコードが準識別子に関して少なくとも k-1 件の他レコードと区別不能であることを要求する。


k-匿名性は Sweeney により 2002 年に形式化され、年齢・郵便番号・性別などの準識別子の組合せが少なくとも k 件のレコードに現れる(等価クラスを形成する)ことで再識別攻撃を防ぎます。実現には、一般化(正確な値を範囲や上位カテゴリで置き換える)と抑制(稀少な値を削除する)を用い、Mondrian や Incognito といったアルゴリズムが代表的です。リンク攻撃を抑える一方、等価クラス内で機微属性が同一の場合に発生する同質性攻撃や背景知識攻撃には弱く、これを補うために l-多様性や t-近接性といった拡張が提案されました。k の選定は、データ有用性、リスク許容度、GDPR 前文 26 などの規制期待のバランスで決定します。

  1. 01

    医療データを一般化し、年齢/郵便番号の各組合せが少なくとも 5 名の患者に対応する (k=5)。

  2. 02

    公開研究データで生年月日を「年のみ」に一般化し、k-匿名性を満たす。

よくある質問

k-匿名性 とは何ですか?

Latanya Sweeney が提唱したプライバシーモデルで、データセット内の各レコードが準識別子に関して少なくとも k-1 件の他レコードと区別不能であることを要求する。 サイバーセキュリティの プライバシーとデータ保護 カテゴリに属します。

k-匿名性 とはどういう意味ですか?

Latanya Sweeney が提唱したプライバシーモデルで、データセット内の各レコードが準識別子に関して少なくとも k-1 件の他レコードと区別不能であることを要求する。

k-匿名性 はどのように機能しますか?

k-匿名性は Sweeney により 2002 年に形式化され、年齢・郵便番号・性別などの準識別子の組合せが少なくとも k 件のレコードに現れる(等価クラスを形成する)ことで再識別攻撃を防ぎます。実現には、一般化(正確な値を範囲や上位カテゴリで置き換える)と抑制(稀少な値を削除する)を用い、Mondrian や Incognito といったアルゴリズムが代表的です。リンク攻撃を抑える一方、等価クラス内で機微属性が同一の場合に発生する同質性攻撃や背景知識攻撃には弱く、これを補うために l-多様性や t-近接性といった拡張が提案されました。k の選定は、データ有用性、リスク許容度、GDPR 前文 26 などの規制期待のバランスで決定します。

k-匿名性 からどのように防御しますか?

k-匿名性 に対する防御は通常、上記の定義で述べたとおり、技術的統制と運用上の実践を組み合わせます。

k-匿名性 の別名は何ですか?

一般的な別名: k-匿名化。

関連用語