我们怎么知道Lucene中的索引是否正确?
我创建了一个简单的程序,它创建了Lucene索引并将其存储在一个文件夹中。使用诊断工具Luke我可以查看索引并查看内容。
我意识到Lucene是构建搜索引擎的标准框架,但我想确保Lucene为文件中存在的每个术语编制索引。
我可以验证Lucene索引创建是否可靠?甚至没有一个术语丢失了?
答案 0 :(得分:3)
您始终可以构建一个小程序,该程序将执行索引内容时使用的相同analysis。然后,对于所有术语,查询索引以确保文档在结果中。重复所有内容。但就个人而言,我不会在此浪费时间。如果你可以在Luke中打开你的索引,如果你可以进行一些查询,那么一切都很好。
通常,真正的问题是您对内容所做的分析是否适合针对您的索引进行的查询。您必须确保索引在recall and precision之间保持良好的平衡。