我了解默认评分功能使用TF * IDF或其类似变体。但是,我不清楚这在查询中如何工作,例如BooleanQuery
。
说我创建了一个BooleanQuery
,其中有许多TermQuery
和Occur.SHOULD
。是否整体考虑了查询的TF?例如。如果我的BooleanQuery
包含两个{hello“这两个TermQuery
,则“ hello”的TF在查询本身中会很高。考虑了吗?还是只考虑针对单个文档的不同TF?
查看MoreLikeThis(...)
的源代码,似乎在查询本身中考虑了TF。在Lucene中是否有类似的类可以做到这一点,或者所有查询都可以做到这一点?