让我们说,我有一张表objects
。它包含字段id
,name
,misc
。
如何查找具有相似或重复name
值的行?我可以看到MySQL可以用于搜索重复值,但不能用于类似的值,例如。 PHP Hypertext Preprocessor
和PHP Hypertext Postprocessor
(约占源值的90%)。
可以用Sphinx进行吗?怎么样?
答案 0 :(得分:1)
我不知道狮身人面像的细节,但你所说的话听起来像计算Levenshtein Distances。快速搜索“sphinx php levenshtein”我发现this线程描述了一种可能对你有用的方法。希望这能让你有所作为。
答案 1 :(得分:0)
sphinx的'suggest'示例可能是有用的起点。
http://code.google.com/p/sphinxsearch/source/browse/trunk/#trunk%2Fmisc%2Fsuggest