我在lucene.Net中做过模糊搜索。在此,如果我搜索Feature
,则Feature
,Featured
,featuring
应该会出现。但数据基于文本匹配,如venture
,{ {1}}等culture
在模糊搜索中匹配。我的代码是
ture
答案 0 :(得分:2)
你应该看一下名为“Lemmatisation”的过程(http://en.wikipedia.org/wiki/Lemmatisation)。您希望根据单词的基本形式(称为引理)构建索引 - 您应该对查询执行相同的操作。
Lucene开箱即用支持英语,所以不应该有任何问题。
答案 1 :(得分:0)
您可以传递检查minimumscore属性的其他过滤器以及可以提高结果质量的minimumsimilarity属性。我在特定场景中所做的其他事情是使用多种不同的查询类型并组合结果(过滤掉低分)并返回组合列表。这对于像引擎这样的东西非常有效,它可以动态地“假设你的意思......”结果而不是问你“你的意思”。
答案 2 :(得分:0)
您可能需要设置Parser.FuzzyMinSim