如何在Lucene中使用百分比(浮动)相似性模糊查询?

时间:2019-03-29 09:38:28

标签: lucene full-text-search fuzzy-search

Lucene,版本:7.3.0。

我想要做的是在 Lucene 中使用百分比(浮动)相似性模糊查询(FuzzyQuery类)。

defaultMinSimilarity现在已被弃用,因此我只能将defaultMaxEdits用于我的目的。

据我所知,org.apache.lucene.search.FuzzyQuery的最大支持距离不能超过2:

MAXIMUM_SUPPORTED_DISTANCE = 2

如果我要搜索 55%相似的字符串,但要查找长度很大的单词怎么办? 如何使用 Lucene FuzzyQuery来做到这一点? 我可以完全绕过最大两步编辑距离限制吗?

1 个答案:

答案 0 :(得分:1)

您可以绕过该FuzzyQuery限制吗?不,你能做到吗?几乎可以肯定,但是您需要重新考虑问题。 FuzzyQuery不是答案。

您应该考虑如何使用分析来解决问题。索引NGrams将是非常宽松,模糊样式匹配的最直接解决方案,请参见NGramTokenFilter