删除重复项而不考虑位置

时间:2012-12-10 14:57:16

标签: search solr indexing

是否有任何过滤器工厂可用于在不考虑位置的情况下删除重复项?

我无法使用RemoveDuplicatesTokenFilterFactory,因为它会考虑位置 [stack]

1 个答案:

答案 0 :(得分:1)

我有一个类似的问题,在字段中有很多重复值,我希望它们是唯一的。解决方案是将处理器添加到 solrconfig.xml 文件中。以下是示例。列出的字段的每个值都是唯一的。我的字段名称是 ingredient_substance,active_moiety ...

<updateRequestProcessorChain>
    <processor class="org.apache.solr.update.processor.UniqFieldsUpdateProcessorFactory">
        <lst name="fields">
            <str>ingredient_substance</str>
            <str>active_moiety</str>
            <str>generic_medicine</str>
            <str>inactive_ingredient_substance</str>
        </lst>
    </processor>
    <processor class="solr.RunUpdateProcessorFactory"/>
</updateRequestProcessorChain>