Lucene允许您使用位置和偏移来索引术语,但即使没有它也可以使用短语搜索。那么lucene如何在没有这些信息的情况下计算索引中的词序呢?
答案 0 :(得分:1)
也许你会使用倒排索引来混淆termvectors位置/偏移。
Termvectors不用于搜索。
要排除实际过帐列表中的邻近度信息:请使用IndexOptions.DOCS_ONLY或IndexOptions.DOCS_AND_FREQS。如果这样做,PhraseQueries将无法工作。
但是如果你愿意接受一些不准确之处,这些设置可以与word-ngram(shinglefilters)结合使用,用于快速短语“近似”......,当然它们对于接近的领域很有用不适用:如数字字段,唯一ID字段等