我在电脑上使用Solr 4.1。我在核心仪表板中看到Num Docs:10961和Max Doc:10961。在观察计算机中的源文件夹之后,有10965个,即比索引文件多4个文件。我的计算机上的Solr和文件夹中必须有相同数量的文件。现在我有一个任务来识别丢失的文件并将它们存储为索引。索引文档id(对于每个文档始终是唯一的)是物理位置的完整路径,例如
" id":" E:\ ABCFolder \ 1 \ test file.pdf"
我需要有人帮助解决以下问题:
找出已发布的索引和源文件中丢失文件的方法是什么?
注意:我知道一种无聊的方法是在源文件夹中搜索Solr查询窗口中的每个文件名,看看文件是否存在。