在MySQL中查找类似/重复的字段值(与Sphinx相关)

时间:2012-02-27 14:23:26

标签: php mysql sphinx

让我们说,我有一张表objects。它包含字段idnamemisc

如何查找具有相似或重复name值的行?我可以看到MySQL可以用于搜索重复值,但不能用于类似的值,例如。 PHP Hypertext PreprocessorPHP Hypertext Postprocessor(约占源值的90%)。

可以用Sphinx进行吗?怎么样?

2 个答案:

答案 0 :(得分:1)

我不知道狮身人面像的细节,但你所说的话听起来像计算Levenshtein Distances。快速搜索“sphinx php levenshtein”我发现this线程描述了一种可能对你有用的方法。希望这能让你有所作为。

答案 1 :(得分:0)

sphinx的'suggest'示例可能是有用的起点。

http://code.google.com/p/sphinxsearch/source/browse/trunk/#trunk%2Fmisc%2Fsuggest