Lucene指数MAXFieldLength

时间:2012-07-24 19:23:40

标签: lucene

我是Lucene的新手,我正在使用Lucene和Java。我正在阅读涵盖2.4版本的动作书中的lucene。同样,索引编写器构造函数参数中的max字段长度将设置为unlimited。现在请参考javadocs,我推断如果我们想设置字段长度,那么我们使用LimitTokeneAnalyser。我运行了一个示例程序,其中我实例化了一个标准分析器,并使用返回255的gerMaxFieldLength方法进行检查。因此,只能使用标准分析器对255进行索引,并且不允许使用无限字段长度选项。我们可以做到这一点吗? maxField长度是否表示该文档字段中的字符数为255?

2 个答案:

答案 0 :(得分:1)

IndexWriter.MaxFieldLength至少存在于Lucene至v3.0.2中。从v3.0.2开始,MaxFieldLength的默认值为10,000。

答案 1 :(得分:1)

LimitTokenCountAnalyzer构造函数中,您可以轻松设置此“maxTokenCount”,这是API:

  

https://lucene.apache.org/core/3_6_0/api/core/org/apache/lucene/analysis/LimitTokenCountAnalyzer.html#LimitTokenCountAnalyzer(org.apache.lucene.analysis.Analyzer,   INT)