Solr admin显示索引数(numDocs)大于我处理的文件数

时间:2014-10-13 15:38:05

标签: django solr indexing django-haystack

当我用Solr处理56个文件时,它说,' numDoc:74'。我不清楚为什么存在比处理文件更多的索引,但我提出的一个解释是,一些处理过的文件的索引太大,所以它们被分成多个索引(我使用丰富的内容提取所有已处理的文件)。这只是一个想法,所以我不想直接认为它是真的。任何人都可以提供替代解释或确认这个吗?

使用Django + Haystack + Solr。

非常感谢

1 个答案:

答案 0 :(得分:0)

遗憾的是,您的术语都不正确,但故障排除过程应该非常简单。 Solr自带管理控制台。通常在 http:// [localhost或domain]:8983 / solr / 。去那里,在下拉列表中找到您的收藏(我假设Solr 4)并在查询屏幕中运行默认查询。那应该会给你所有文件,你可以看到附加内容。

我怀疑您的独特ID和/或重建索引可能存在一些问题。但是,只需少量文档,您就可以查看Solr中实际存储的内容并找出不正确的内容。