我需要比较两个字符串,看它们是匹配还是近似匹配

时间:2013-01-08 10:16:38

标签: string comparison string-comparison fuzzy-logic

我有一系列公司名称来自网页搜索,我试图将它们与其他公司名称表进行比较,以确定它们是匹配还是近似匹配;

  • Some Company Ltd.
  • Another Company Limited
  • 本公司

  • Some Company Ltd.

  • Another Company Ltd.
  • That Limited

因此,比较两个列表应将前两行标记为匹配,第二行标记为匹配,第三行标记为不匹配。根据我的理解,这是一个模糊搜索,但我是在对如何最好地实现这一目标做了一些澄清之后?有什么想法或建议吗?

1 个答案:

答案 0 :(得分:1)

请参阅:http://en.wikipedia.org/wiki/Levenshtein_distance 可以在外部链接中找到C实现:MySQL中的Levenshtein