如何索引Lucene文档中的所有术语?

时间:2012-01-31 04:47:14

标签: java lucene indexing full-text-search

我正在编制索引的文件非常庞大。默认情况下,Lucene仅索引文档的前10,000个术语以避免OutOfMemory错误。因此,我在搜索索引时收到不正确的匹配。我如何索引文档中的所有条款?

1 个答案:

答案 0 :(得分:0)

IndexWriter.MaxFieldLength。指定IndexWriter构造函数中的最大字段长度(以令牌/术语的数量为单位)

您可以将最大值设置为IndexWriter构造函数MAX_VALUE - Lucene Recent VersionsUNLIMITED - Lucene Older Versions的一部分。

您还可以使用IndexWriter.setMaxFieldLength(int)覆盖构造函数设置的值。