忽略类似的值,不要将其视为重复记录

时间:2014-10-24 20:01:56

标签: sql sql-server

我在SQL服务器上编写了一个Select查询,我发现了一个问题。 当我有两行时:

ID     Address        City      Zip
1   123 Wash Ave.  New York    10035
1   123 Wash Ave   New York    10035

因为我有很多相同的地址,但其中一些只有点或一点点差异。 它们几乎相同,所以我怎么能找到所有这样的情况。

1 个答案:

答案 0 :(得分:0)

使用UPS Online API,我们的解决方案不是纠正错误,而是帮助对最能代表正确答案的结果进行排序。

根据UPS返回的结果,我们将针对原始源地址和每个返回的响应运行各种过滤器。然后生成一个加权系统,对结果进行排序,以便我们的CSR选择最合理的格式化的#34;从UPS回答。

这样就可以从结果集中建立一张记分卡,例如邮政编码中的数字位数不正确(抓住胖指法)。

另一项措施删除了所有发音标记,并给出了现在地址接近程度的排名。

最后,我们通过标准替换矩阵[STREET ST]传递结果并进行最终排名。

从所有这些分数中,我们对最有可能最不可能的个体进行排序和呈现,然后选择正确的答案以保存在我们的数据库中。

纠正这些错误现在有两个目的: 1)通过在账单上提供正确的地址信息,我们对客户看起来很好(不够近) 2)我们通过不收取错误地址的费用来节省UPS的二次费用。