在Elasticsearch的文档中,在"Theory behind Relevance Scoring"部分下,指定该软件使用Lucene's practical scoring function,它计算文档 d 与搜索查询的匹配分数< em> q 考虑术语频率和 d 中术语的逆文档频率,按文档长度进行归一化和加权。实用评分函数(psf)用于计算多项查询的相关性。
现在,它还说它使用向量空间模型来计算文档的多项查询的相似性(使用余弦相似性)。
问题是:如果通过psf计算排名,为什么需要进行相似度计算呢?是不是已经意味着对文档进行排名的相关性得分? 这两件事如何互动?