Solr找到最常用的单词

时间:2014-08-15 11:06:26

标签: solr solr4

我需要在Solr集合中找到最常用的10个单词。 我试过了,

http://localhost:8983/solr/admin/luke?fl=content1&numTerms=10

它给出了结果。但它给出了大多数文档中出现的单词。如果文档中有重复的单词,则不会计算它们。

如何解决这个问题?

1 个答案:

答案 0 :(得分:1)

事实上,我认为重复的单词会被计算在内。但你不要求solr向你显示重复项。你可能会尝试使用reportDocCount = true参数:

http://localhost:8983/solr/admin/luke?fl=content1&numTerms=10&reportDocCount=true

请注意,如果您没有优化索引,将会显示已删除的出现。

See the LukeRequestHandler doc on solr: