我希望在TSQL(没有MDS)中实现一种用于比较全名的模糊匹配算法。名称来自单独的手动输入,无法控制输入内容。其中一种系统还倾向于切断名称的结尾,因为它的字符数限制较低。作为我正在查看的这类数据的一个极端示例:
System1Name System2Name
----------- -----------
Katherine G Livingstone Kat George Livingst
我绝对不是在这里寻找完美的匹配,但是希望有人可以为这样的事情推荐一种算法。我已经研究了Jaro-Winkler距离和Soundex,但是我不确定是否最好将基于距离的算法或语音算法用于此类数据。有想法吗?