我是lucene搜索的初学者。如果我有一个集合资源,如: id,name,{list of products},{list of keywords}。如果我想根据名称或产品或关键字进行搜索。我对lucene及其用法有一些疑问: 1)对于文档创建,我创建了一个具有id,name,products(多个值),关键字(多个值)结构的文档。如果我有一千个独特的资源,它会创建1000个独特的文档吗? 2)另外,如果我将名称和产品字段作为可搜索字段(如StringField),那么在搜索之后,结果是否还包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?
答案 0 :(得分:1)
Q> < ..>它会创建1000个独特的文件吗? A> Lucene没有“唯一性”的概念 - 它只在你的头脑中。或者,将此视为Lucene的所有文档都是唯一的。如果您按这些字段搜索,将返回相关文档。
Q> < ..>结果是否也包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?
A> 奇怪/不清楚的问题。如果您搜索所有文档,您将获得所有文档。如果您的搜索查询仅匹配某些文档,则会返回部分文档。内部结构更复杂 - 这完全取决于您如何分析文本。也许您可以更多地给出用例的具体示例?