l-多様性
l-多様性 とは何ですか?
l-多様性Machanavajjhala らによる k-匿名性の拡張で、各等価クラスにおいて機微属性ごとに少なくとも l 種類の十分代表される値を含めることを要求する。
2007 年に提案された l-多様性は、k-匿名性の二つの弱点、すなわち等価クラス内のすべてのレコードが同一の機微値を持つ「同質性攻撃」と背景知識を用いた攻撃に対処します。各等価クラス内の機微属性に対して、十分に代表される異なる値が少なくとも l 個存在することを保証することで、攻撃対象を 1 クラスに絞り込んでも機微値を特定できないようにします。バリエーションには、distinct l-diversity、エントロピー l-diversity、再帰的 (c, l)-diversity があり、プライバシー強度と情報損失のバランスが異なります。l-多様性は、k-匿名性や t-近接性と併用され、ARX・sdcMicro・Amnesia などのツールで医療・センサス・調査データの公開に活用されます。
● 例
- 01
公開前に、年齢/郵便番号で分けた各患者グループに少なくとも 3 種類の異なる診断が含まれるようにする。
- 02
給与データセットにエントロピー l-多様性を適用し、いずれの等価クラスも単一の所得帯で占められないようにする。
● よくある質問
l-多様性 とは何ですか?
Machanavajjhala らによる k-匿名性の拡張で、各等価クラスにおいて機微属性ごとに少なくとも l 種類の十分代表される値を含めることを要求する。 サイバーセキュリティの プライバシーとデータ保護 カテゴリに属します。
l-多様性 とはどういう意味ですか?
Machanavajjhala らによる k-匿名性の拡張で、各等価クラスにおいて機微属性ごとに少なくとも l 種類の十分代表される値を含めることを要求する。
l-多様性 はどのように機能しますか?
2007 年に提案された l-多様性は、k-匿名性の二つの弱点、すなわち等価クラス内のすべてのレコードが同一の機微値を持つ「同質性攻撃」と背景知識を用いた攻撃に対処します。各等価クラス内の機微属性に対して、十分に代表される異なる値が少なくとも l 個存在することを保証することで、攻撃対象を 1 クラスに絞り込んでも機微値を特定できないようにします。バリエーションには、distinct l-diversity、エントロピー l-diversity、再帰的 (c, l)-diversity があり、プライバシー強度と情報損失のバランスが異なります。l-多様性は、k-匿名性や t-近接性と併用され、ARX・sdcMicro・Amnesia などのツールで医療・センサス・調査データの公開に活用されます。
l-多様性 からどのように防御しますか?
l-多様性 に対する防御は通常、上記の定義で述べたとおり、技術的統制と運用上の実践を組み合わせます。
l-多様性 の別名は何ですか?
一般的な別名: k-匿名性 + l-多様性。
● 関連用語
- privacy№ 576
k-匿名性
Latanya Sweeney が提唱したプライバシーモデルで、データセット内の各レコードが準識別子に関して少なくとも k-1 件の他レコードと区別不能であることを要求する。
- privacy№ 1126
t-近接性
Li、Li、Venkatasubramanian によるプライバシーモデルで、l-多様性を強化し、各クラスにおける機微属性の分布が全体分布から閾値 t を超えて乖離しないことを要求する。
- privacy№ 274
データ匿名化
他の利用可能な情報と組み合わせても直接的・間接的に個人を識別できないよう、個人データを不可逆に変換する処理。
- privacy№ 317
差分プライバシー
統計の公表やモデル学習に伴うプライバシー損失を数理的に定量化し、校正されたノイズを加えることで個人の寄与を証明可能な範囲内に抑える枠組み。
- privacy№ 875
仮名化
個人データの直接識別子を可逆的なエイリアスに置き換え、別途保管される追加情報がなければ個人に紐付けられない状態にする手法。
- privacy№ 280
データ最小化
明示された適法な目的に必要な範囲でのみ個人データを取得・処理・保存することを求めるプライバシー原則。