是否有匹配短语的搜索算法/方法?

时间:2011-12-08 12:51:17

标签: algorithm search

我正在尝试制作一个搜索工具,用于搜索给定短语的少量对象(大约1000个,每个对象有大约3个我要搜索的文本字段)。

我试图找到一种能为我排名搜索结果的算法。许多主题导致模糊匹配和Levenshtein距离算法,但这似乎不适合这种情况(例如,它会说短语“猫和狗”更接近“汽车和齿轮”而不是它“狗和猫”)。

是否存在专用于将搜索短语与其他文本块进行匹配的算法/方法,并根据文本相等,包含的搜索短语,包含的单个单词等对结果进行排名。我不这样做甚至知道什么是正常的。

我通常用c#编写代码。我没有使用数据库。

1 个答案:

答案 0 :(得分:0)

看看Lucene。它可以执行所有类型的文本索引,返回排名结果,以及许多其他好东西。在C#中有一个实现。这对你的用例来说可能有点过分,但它是一款非常优秀且实用的技术,你应该真正了解它,几乎可以肯定你在职业生涯中会很好地使用它。