我需要在Solr集合中找到最常用的10个单词。 我试过了,
http://localhost:8983/solr/admin/luke?fl=content1&numTerms=10
它给出了结果。但它给出了大多数文档中出现的单词。如果文档中有重复的单词,则不会计算它们。
如何解决这个问题?
答案 0 :(得分:1)
事实上,我认为重复的单词会被计算在内。但你不要求solr向你显示重复项。你可能会尝试使用reportDocCount = true参数:
http://localhost:8983/solr/admin/luke?fl=content1&numTerms=10&reportDocCount=true
请注意,如果您没有优化索引,将会显示已删除的出现。