全文地址匹配

时间:2011-06-10 13:51:47

标签: sql sql-server-2008 string-matching

我正在寻找重复记录。我有一个属性表,其中包含街道,数字,城市,州,县和邮政。它们根据位置进行地理编码,但数据中存在一些漏洞。问题是如果他们输入一个简单的输入错误或省略某些字段,它们就不会出现匹配。

截至目前,直接=比较和LIKE并没有真正做得很好。但是Jaro Winkler和类似的编辑距离算法运行时性能极差。

1 个答案:

答案 0 :(得分:0)

来自CASS-Certified Scrubbing ServiceSmartyStreets提供了重复数据删除功能,作为其地址验证流程的一部分。只需将数据上传到分隔的文本文件中,重复项就会标记在您下载的output file上。对于您处理的每个文件,始终都有免费预览,因此您不必在对结果满意之前购买任何内容。我是SmartyStreets的软件开发人员并帮助编写了应用程序。我对它的功能和易用性非常满意。我们还有一个API您可以使用,但重复数据删除将是您的责任(只需比较完整的12位数的交付点条形码,它作为地址的唯一标识符)。