我正在使用Lucene索引具有相对大量(数十万)动态创建/更新/删除文件的目录。我每个文件都有一个Lucene文档,文件名是文档中的一个字段。
Document doc = new Document();
doc.add(new StringField("id", file.getName(), Store.YES));
doc.add(new LongField("stamp", file.lastModified(), Store.YES));
doc.add(new StringField("path", file.getAbsolutePath(), Store.YES));
如何(越快越好)迭代索引中涉及文件系统中缺少的文件的所有文档?
答案 0 :(得分:1)
除非关于文件是否丢失的信息以某种方式直接存储在索引中,否则我没有看到任何比简单地迭代每个文档(使用MatchAllDocsQuery
)并检查每个文档是否存在更快的方法File.exists()
。