问题是我们的一个术语可能非常普遍(例如数字" 3")。在这种情况下,我想在Lucene运行查询时限制搜索结果的数量。这甚至可能吗? 只是强调 - 我不想仅仅限制Lucene搜索结果(可以使用IndexSearher.Search方法中的第二个数字参数轻松完成)。我想告诉Lucene类似的东西 - 不要花太多时间搜索特定术语的点击量。如果你发现,让我们说,一个1,000,000 - 停止寻找并转到其他条款。
答案 0 :(得分:2)
因为这个词很常见,所以idf会很高(或者很低,取决于你的观点),所以由于Lucene的pruning algorithms,它可能会相对无关紧要。您可以随时更改增强功能,使其更重要,但我会仔细检查这是否是您的性能瓶颈。