我想到的一个解决方案是 - 找到2个地址之间的距离并使用它们的接近程度去除它们。但是,如果客户搬到隔壁或建筑物内的不同公寓,那么这将失败。
有没有人遇到过这个问题?什么是理想的解决方案?
答案 0 :(得分:0)
我觉得我错过了你情况的某些背景,但是我在这里是如何处理地址记录的重复数据删除。 (此解决方案不需要任何地理编码信息。)
首先,使用标准化所有地址组件的服务/ API验证地址。然后在串联字符串中计算以下经过验证和标准化的地址组件的哈希值:
"<street1>|<city>|<state>|<full-12-digit-delivery-point-barcode>"
(交货点条形码,或DPBC,是9位邮政编码加上来自USPS的一些额外交付信息)
然后,检查预先存在的&#34;设置&#34;对于那个哈希。如果它已经存在,那么您有一个重复的地址。如果没有,请添加它,以便您可以检测该地址的未来重复项。
对于某些应用程序,包括&#34;收件人&#34;对于其他不合适的人来说,信息是一项要求。
我是SmartyStreets的开发人员,这是一家地址验证软件商店,我们使用这种技术非常有用。
答案 1 :(得分:0)