给出了两个带有客户信息的表。一种是销售数据,另一种是浓缩图。两个表中都存在客户名称字段,同时也是居住国家和居住城市。后两个是干净的数据。
不幸的是,客户名称很接近,但有时会稍有不同。 (例如:维也纳大学vs维也纳工业大学)。
我的目标是联接表,并用充实映射表信息充实销售表。
因此,我想在mssql中设置模糊匹配,我想用于联接的两列不一定100%匹配。 从技术上讲,我知道可以使用模糊连接程序包在R中涵盖此主题,但我真的希望将其保留在mssql中。
我想问一下是否有办法吗?
答案 0 :(得分:1)
有很多方法可以做到这一点。内置SOUNDEX函数是一种可能使您接近的方法。如果这样不起作用,您可以尝试以下操作:姓氏的前四个字母+姓氏的前两个字母。
答案 1 :(得分:0)
对此没有简单的答案,有些可用的算法可能需要开发CLR函数。 question中有一个很好的讨论,它就是答案。