应用错误收集

您尚未指定Lucene版本，因此我假设您使用的是6.x.x. 您看到的行为是Lucene模糊搜索的正确行为。

参考this，我引用，

此查询最多可匹配最多2次修改的条款。

大致但非常准确地表示如果使用FuzzyQuery，在任何位置最多两个字符变化的两个文本将作为匹配返回。

以下是我在此处说明的一个简单Java程序的示例输出

让我们说三个索引文档的字段值如下 -   ＆＃34; 123456787＆＃34; ，＆＃34; 123456788＆＃34; ，＆＃34; 123456789＆＃34; （附7,8和9）    - 12345678）

结果：

找不到搜索字符串的匹配数 - ＆gt; 123456（编辑距离= 3，最后   缺少3位数字）

发现3个文件!! for Search String - ＆gt; 1234567（编辑距离= 2）

发现3个文件!! for Search String - ＆gt; 12345678（编辑距离= 1）
     找到1个文件!! for Search String - ＆gt; 1236787（编辑距离= 2表示   找到一个，遗漏了两个文件的4,5和最后一位数字）

找不到搜索字符串的匹配数 - ＆gt; 123678789（编辑距离= 4，   缺少4,5和最后两位数字）

所以你应该阅读更多关于编辑距离的信息。

如果您的要求是匹配N-Continuous字符而不必担心编辑距离，则N-Gram Indexing using NGramTokenizer是可行的方法。

有关N-Gram

的更多信息，请参阅此处

使用Lucene模糊搜索与没有别名的单词

1 个答案: