Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 1126

t-接近度

t-接近度 是什么?

t-接近度Li、Li 与 Venkatasubramanian 提出的隐私模型,要求每个等价类中敏感属性的分布与全局分布的差距不超过阈值 t,以增强 l-多样性。


2007 年提出的 t-接近度,针对 l-多样性面对偏斜与相似性攻击时的不足,要求每个等价类中敏感属性的分布与整体数据集中该属性的分布之间的距离不超过阈值 t,通常采用 Earth Mover's Distance 衡量。这样可以避免当某个等价类被语义相近但不同的取值主导(如多种罕见癌症)时,攻击者推断出敏感值。降低 t 通常会损失更多数据效用,需要更高程度的泛化或压制,因此 t 的取值需在风险与效用之间权衡。t-接近度常与 k-匿名性、l-多样性叠加应用于医疗、政府与研究数据发布。

示例

  1. 01

    确保每个 "性别/年龄" 单元中的薪资分布与总体分布的距离不超过 t=0.2。

  2. 02

    应用 t-接近度,使任一等价类不会过度集中于某种罕见疾病。

常见问题

t-接近度 是什么?

Li、Li 与 Venkatasubramanian 提出的隐私模型,要求每个等价类中敏感属性的分布与全局分布的差距不超过阈值 t,以增强 l-多样性。 它属于网络安全的 隐私与数据保护 分类。

t-接近度 是什么意思?

Li、Li 与 Venkatasubramanian 提出的隐私模型,要求每个等价类中敏感属性的分布与全局分布的差距不超过阈值 t,以增强 l-多样性。

t-接近度 是如何工作的?

2007 年提出的 t-接近度,针对 l-多样性面对偏斜与相似性攻击时的不足,要求每个等价类中敏感属性的分布与整体数据集中该属性的分布之间的距离不超过阈值 t,通常采用 Earth Mover's Distance 衡量。这样可以避免当某个等价类被语义相近但不同的取值主导(如多种罕见癌症)时,攻击者推断出敏感值。降低 t 通常会损失更多数据效用,需要更高程度的泛化或压制,因此 t 的取值需在风险与效用之间权衡。t-接近度常与 k-匿名性、l-多样性叠加应用于医疗、政府与研究数据发布。

如何防御 t-接近度?

针对 t-接近度 的防御通常结合技术控制与运营实践,详见上方完整定义。

t-接近度 还有哪些其他名称?

常见的别称包括: t-接近度匿名化。

相关术语