如何计算全名之间的相似度?

时间:2015-03-07 12:15:45

标签: algorithm pattern-matching match similarity

我有两个应根据全名匹配的项目列表。对于确切的名称,应该没有问题,但如果全名包含缺少或缩写的部分,如

,那该怎么办?
  • " John Blair Smith" vs" John B. Smith"或
  • " John Blair Smith" vs" John B. Campbell Smith"

可以使用哪种算法计算加权相似度,然后根据相似度得分匹配不同列表中的这些名称?

1 个答案:

答案 0 :(得分:0)

使用字符串距离算法之一。其中有很多:

  • 汉明距离
  • Levenshtein距离
  • Damerau-Levenshtein距离
  • 最佳字符串对齐
  • 还有更多..

让我们在这篇关于Comparison of String Distance Algorithms的文章中激励自己。