Lucene,版本:7.3.0。
我想要做的是在 Lucene 中使用百分比(浮动)相似性模糊查询(FuzzyQuery
类)。
defaultMinSimilarity
现在已被弃用,因此我只能将defaultMaxEdits
用于我的目的。
据我所知,org.apache.lucene.search.FuzzyQuery
的最大支持距离不能超过2:
MAXIMUM_SUPPORTED_DISTANCE = 2
如果我要搜索 55%相似的字符串,但要查找长度很大的单词怎么办?
如何使用 Lucene 的FuzzyQuery
来做到这一点?
我可以完全绕过最大两步编辑距离限制吗?
答案 0 :(得分:1)
您可以绕过该FuzzyQuery
限制吗?不,你能做到吗?几乎可以肯定,但是您需要重新考虑问题。 FuzzyQuery
不是答案。
您应该考虑如何使用分析来解决问题。索引NGrams将是非常宽松,模糊样式匹配的最直接解决方案,请参见NGramTokenFilter。