使用python识别同一列中具有大容量的单列中的重复记录

时间:2017-05-04 09:08:46

标签: python database duplicates

我们在一列中有大量数据,我们需要使用python识别重复/可能重复。

拉斯维加斯大道,Blvd S

3745 Las Vegas Blvd S

拉斯维加斯大道南拉斯维加斯大道3745号

Raintree At Polo Towers Las Vegas - 拉斯维加斯

Raintree的Polo Towers

钻石度假村马球塔

波罗大厦钻石度假村 - 拉斯维加斯

我需要在我的数据库中识别上面的实例。任何人都可以通过python帮助解决这个问题,提前谢谢。

1 个答案:

答案 0 :(得分:0)

嗯,你可以用','来分割字符串,然后按照固定后输出的每个元素搜索表格,如下所示:

SELECT @variable = top(1), columnname from yourtable

SELECT * from youtable WHERE Split(@variable) LIKE '%"+columname+"%'
  1. 您需要逗号或任何其他分隔符的分割功能
  2. 你必须为yourtable中的每个元素进行迭代,在我的例子中我只使用了第一个(TOP(1))