如何在Solr / Lucene中排除某些URL

时间:2010-09-01 21:34:08

标签: lucene solr

我在网站上设置了Solr索引的新实例。我希望Solr NOT不为某些URL模式编制索引。有没有办法提到这种排除模式?

此致 第

3 个答案:

答案 0 :(得分:2)

只有当模式与排除模式不匹配时,才能在程序中完成索引。

答案 1 :(得分:1)

您可以使用UpdateRequestProcessor在Solr中进行过滤。在该UpdateRequestProcessor中,您可以决定是否将文档编入索引,如果它与您的正则表达式匹配。

答案 2 :(得分:1)

您是否有抓取工具并收集数据?我倾向于在爬虫中执行该逻辑。 Solr更像是存储库,我认为它不是放置大量索引逻辑的最佳位置。

埃里克