如何知道每日索引文档的apache solr的状态

时间:2015-03-10 06:24:05

标签: apache indexing solr elasticsearch lucene

我正在使用apache solr 4.10.x. APache nutch习惯于抓取和索引文档。现在我的爬虫正在运行,我想知道每次迭代的nutch或每天索引的文档数量。

apache solr为此目的提供的任何想法或任何工具?

2 个答案:

答案 0 :(得分:1)

facet=true
facet.date=myDateField
facet.date.start=start_date
facet.date.end=end_date
facet.date.gap=+1MONTH(duration like +1DAY in your case).
如果您使用带有&。

的HTTP请求,

会在您的网址中附加所有内容

答案 1 :(得分:1)

您可以使用command = status命中网址 例如在我的情况下它是 QT = / dataimport&安培;命令=状态

它为您提供已提交或回滚或已处理的总文档等状态...

了解更多信息 http://wiki.apache.org/solr/DataImportHandler

检查"命令"