lucene短语如何在没有位置和偏移索引的情况下工作?

时间:2012-03-12 17:49:52

标签: solr lucene full-text-search phrase

Lucene允许您使用位置和偏移来索引术语,但即使没有它也可以使用短语搜索。那么lucene如何在没有这些信息的情况下计算索引中的词序呢?

1 个答案:

答案 0 :(得分:1)

也许你会使用倒排索引来混淆termvectors位置/偏移。

Termvectors不用于搜索。

要排除实际过帐列表中的邻近度信息:请使用IndexOptions.DOCS_ONLY或IndexOptions.DOCS_AND_FREQS。如果这样做,PhraseQueries将无法工作。

但是如果你愿意接受一些不准确之处,这些设置可以与word-ngram(shinglefilters)结合使用,用于快速短语“近似”......,当然它们对于接近的领域很有用不适用:如数字字段,唯一ID字段等