当个人有多个地址时,你如何为重复数据删除制作地名录?

时间:2015-07-09 17:39:52

标签: python duplicates python-dedupe

根据数据制作的Dedupe documentation,似乎地名词典需要有清晰,独特的个人级数据。

如果个人多次搬家,换工作等,你会怎么做?每个人包含多个观察结果,并且智能填充空白?

1 个答案:

答案 0 :(得分:2)

如果你知道一个人拥有多个地址,那么我会创建一个地理位置'像这样。

Address                Name      Person_ID
123 Main St.           John Doe  1
100 High St.           John Doe  1
1600 Pennsylvania Ave  John Doe  1

当您与此匹配时,您将有第二个分辨率步骤,您按Person_ID

进行合并