Lucene“包含”对索引子集的搜索

时间:2012-04-18 15:41:48

标签: lucene.net

我有一个大约500万个文档的索引,我正在尝试“包含”搜索。我知道如何实现这一点,我已经向客户解释了性能成本,但这正是他们想要的。正如预期的那样,对整个索引进行“包含”搜索非常慢,但有时我只想搜索索引的一个非常小的子集(比如100个文档左右)。我通过在搜索中添加一个过滤器来完成此操作,该过滤器应该正确地限制结果。但是我发现这个搜索和整个索引搜索的表现几乎完全一样。这里有什么我想念的吗?感觉这个搜索也在搜索整个索引。

2 个答案:

答案 0 :(得分:1)

在搜索中添加过滤器不会限制索引的范围。

您需要更清楚地了解搜索所需的内容,但我不相信您的想法是可能的。

文件子集是否始终相同?如果是这样,也许你可以通过多个指数变得聪明。 (例如,搜索较小的索引,如果没有足够的命中,则搜索较大的索引)。

答案 1 :(得分:1)

您可以尝试SingleCharTokenAnalyzer