SOLR 1.4中现场倒塌的最佳实践

时间:2010-04-08 06:25:39

标签: solr

我需要一种方法来折叠复制(用带有id的字符串字段定义)导致solr。我知道这个功能正在下一个版本(1.5)中出现,但我不能等待。使用当前稳定版本1.4删除重复项的最佳方法是什么?

鉴于在我的情况下找到重复项非常容易(比较一个字符串字段),如果它是一个Filter,我应该覆盖现有的SearchComponent还是编写一个新的Component,还是使用像carrot2这样的外部库?

总体结果计数应反映缩短的结果。

1 个答案:

答案 0 :(得分:6)

嗯,有一个解决方案:只需应用折叠字段修补程序(有关此功能的最新消息,请参阅http://issues.apache.org/jira/browse/SOLR-236,我还建议您http://blog.jteam.nl/author/martijn)。

这样做可以使CollapseComponent正常工作。请注意,此功能会导致搜索性能下降。