如何重复地址记录?

时间:2015-04-20 08:14:10

标签: geolocation geocoding

我想到的一个解决方案是 - 找到2个地址之间的距离并使用它们的接近程度去除它们。但是,如果客户搬到隔壁或建筑物内的不同公寓,那么这将失败。

有没有人遇到过这个问题?什么是理想的解决方案?

2 个答案:

答案 0 :(得分:0)

我觉得我错过了你情况的某些背景,但是我在这里是如何处理地址记录的重复数据删除。 (此解决方案不需要任何地理编码信息。)

首先,使用标准化所有地址组件的服务/ API验证地址。然后在串联字符串中计算以下经过验证和标准化的地址组件的哈希值:

"<street1>|<city>|<state>|<full-12-digit-delivery-point-barcode>"

(交货点条形码,或DPBC,是9位邮政编码加上来自USPS的一些额外交付信息)

然后,检查预先存在的&#34;设置&#34;对于那个哈希。如果它已经存在,那么您有一个重复的地址。如果没有,请添加它,以便您可以检测该地址的未来重复项。

对于某些应用程序,包括&#34;收件人&#34;对于其他不合适的人来说,信息是一项要求。

我是SmartyStreets的开发人员,这是一家地址验证软件商店,我们使用这种技术非常有用。

答案 1 :(得分:0)

您需要应用工具/ API进行地址标准化。只需确保标准化符合严格的,明确定义的格式,例如USPS(Google或Bing API从这个角度来看不符合要求)。一旦标准化,地址就可以作为文字字符串相互比较 - 如果字符串匹配,地址是相同的。我工作的公司制作了这样的工具YAddress

有关重复数据删除过程的详细信息,请参阅我的博文here