Lucene得分:TermQuery w&没有TermVectors

时间:2011-01-05 03:36:04

标签: lucene scoring

当termvectors / position / offsets打开时,TermQuery:ExtractTerms会导致更高的计数吗? (假设匹配发生的次数超过1次)。相反,在关闭反向文件信息的情况下,ExtractTerms是否总是返回1并且只有1个术语?

编辑:打开模式中的termvectors如何以及在何处影响评分?

1 个答案:

答案 0 :(得分:1)

TermQuery.ExtractTerms提取查询中的字词,而不是结果。因此,搜索“foo:bar”将始终返回一个术语,无论索引中包含什么内容。

听起来我想知道highlighting,而不是Query.ExtractTerms

编辑:根据您的评论,听起来您在问:“得分如何受术语向量影响?”答案是:完全没有。术语频率,范数等是在索引时计算的,因此您存储的内容无关紧要。

主要的例外是PhraseQuery使用slop,它使用术语位置。一个小的例外是自定义评分类可以使用他们想要的任何数据,因此不仅术语向量而且有效负载等都可能影响分数。

如果您只是在做TermQuery,那么您存储的内容应该没有效果。