我正在编制索引的文件非常庞大。默认情况下,Lucene仅索引文档的前10,000个术语以避免OutOfMemory错误。因此,我在搜索索引时收到不正确的匹配。我如何索引文档中的所有条款?
答案 0 :(得分:0)
IndexWriter.MaxFieldLength
。指定IndexWriter构造函数中的最大字段长度(以令牌/术语的数量为单位)
您可以将最大值设置为IndexWriter构造函数MAX_VALUE - Lucene Recent Versions或UNLIMITED - Lucene Older Versions的一部分。
您还可以使用IndexWriter.setMaxFieldLength(int)
覆盖构造函数设置的值。