我需要一种方法来折叠复制(用带有id的字符串字段定义)导致solr。我知道这个功能正在下一个版本(1.5)中出现,但我不能等待。使用当前稳定版本1.4删除重复项的最佳方法是什么?
鉴于在我的情况下找到重复项非常容易(比较一个字符串字段),如果它是一个Filter,我应该覆盖现有的SearchComponent还是编写一个新的Component,还是使用像carrot2这样的外部库?
总体结果计数应反映缩短的结果。
答案 0 :(得分:6)
嗯,有一个解决方案:只需应用折叠字段修补程序(有关此功能的最新消息,请参阅http://issues.apache.org/jira/browse/SOLR-236,我还建议您http://blog.jteam.nl/author/martijn)。
这样做可以使CollapseComponent正常工作。请注意,此功能会导致搜索性能下降。