什么是k-匿名和l-多样性,它们之间有什么区别?

时间:2012-07-09 06:40:57

标签: java algorithm

k-anonymity和l-diversity的含义是什么,它们之间有什么区别?这个概念用于以下IEEE论文:see here

1 个答案:

答案 0 :(得分:19)

匿名数据集包含多个可用于识别某人的字段(例如,年龄,性别,位置)。即使一个区域不是唯一的,它们的组合也可能是(例如,在squatsville中可能只有1名54岁的男性)。 k-anonymity大于1意味着即使所有字段都没有标识一个人 - 您也可以识别“k”人。

但这还不够,因为所有由不同领域的不同领域识别出来的k个人可能会有相同的价值 - 如果在squatsville有10个不同的54岁男性并且他们都穿女士服装,那么你知道54岁的鲍勃住在深蹲中,穿着女士服装。因此,您需要在字段标识的组内进行多样化。 l-多样性意味着该组包含“l”(字母L,而不是数字1)不同的值。

[没有冒犯 - 严肃地说 - 对于交叉修饰者。我只想要一些温和有趣的东西,那不是,癌症......]

和参考 - http://www.cs.colostate.edu/~cs656/reading/ldiversity.pdf