TSQL中来自不同手动输入的全名之间的模糊匹配算法?

时间:2018-08-31 16:49:15

标签: tsql sql-server-2016 fuzzy-comparison soundex jaro-winkler

我希望在TSQL(没有MDS)中实现一种用于比较全名的模糊匹配算法。名称来自单独的手动输入,无法控制输入内容。其中一种系统还倾向于切断名称的结尾,因为它的字符数限制较低。作为我正在查看的这类数据的一个极端示例:

System1Name                System2Name
-----------                -----------
Katherine G Livingstone    Kat George Livingst

我绝对不是在这里寻找完美的匹配,但是希望有人可以为这样的事情推荐一种算法。我已经研究了Jaro-Winkler距离和Soundex,但是我不确定是否最好将基于距离的算法或语音算法用于此类数据。有想法吗?

0 个答案:

没有答案