最佳模糊匹配算法?

时间:2009-01-29 10:33:23

标签: fuzzy-search

什么是最好的模糊匹配算法(模糊逻辑,N-Gram,Levenstein,Soundex ....,)能够在更短的时间内处理超过100000条记录?

2 个答案:

答案 0 :(得分:24)

我建议你阅读Navarro在维基百科文章的Refences部分中提到的文章 Approximate string matching。 根据实际研究做出决定总是优于随机提出的建议  陌生人..特别是如果对一组已知记录的表现对你很重要。

答案 1 :(得分:3)

它在很大程度上取决于您的数据。某些记录可以比其他记录更好地匹配。例如,邮政编码是一种定义的格式,因此可以以与普通字符串不同的方式进行比较。人们可以在首字母和DOB或其他组合等方面进行匹配。