我正在使用apache solr 4.10.x. APache nutch习惯于抓取和索引文档。现在我的爬虫正在运行,我想知道每次迭代的nutch或每天索引的文档数量。
apache solr为此目的提供的任何想法或任何工具?
答案 0 :(得分:1)
facet=true
facet.date=myDateField
facet.date.start=start_date
facet.date.end=end_date
facet.date.gap=+1MONTH(duration like +1DAY in your case).
如果您使用带有&。的HTTP请求,会在您的网址中附加所有内容
答案 1 :(得分:1)
您可以使用command = status命中网址 例如在我的情况下它是 QT = / dataimport&安培;命令=状态
它为您提供已提交或回滚或已处理的总文档等状态...
了解更多信息 http://wiki.apache.org/solr/DataImportHandler
检查"命令"