过滤字后如何用Solr获取频率字

时间:2015-07-22 01:34:54

标签: solr filtering solrj facet

我在 Solrj 中使用facet获得了关于频率词的结果,但是在结果列表中,它有一个我不想或想要从文档中跳过来计算的单词。

例如,在文件中

word1 word2 word3 word4 word1 word2 word3

结果将是

word1 : 2
word2 : 2       
word3 : 1
像上面一样。我希望得到像

这样的结果
word1 : 2
word2 : 2   --> dont need to count.....i want to skip it
word3 : 1

我有一个列表类型的单词列表,我想在计算单词时跳过。请帮帮我

1 个答案:

答案 0 :(得分:0)

在前端代码中跳过它可能比在Solr中更容易 - 除非你可以在每次列表更改时重新索引。

如果您只是要编制一次索引(或者可以在列表更改时重新编制索引),请自行创建一个字段并使用停用词过滤器删除您在特定字段中不需要的字词。这种方法的问题在于,当您更新过滤器时,索引中已有的内容不会发生变化。