Question

Sphinx默认排名SPH_RANK_PROXIMITY_BM25的公式如下：

SPH_RANK_PROXIMITY_BM25 = sum(lcs*user_weight)*1000+bm25

分别为每个字段计算最长公共子序列，然后乘以user_weight。但是bm25只是文档范围的变量，并未考虑用户字段。为什么会这样？

Answer 1

仅因为它速度更快，并且在许多情况下质量就足够了。这里有一个自定义的等级和bm25f。默认情况下，文档长度也不作说明，在索引编制过程中需要index_field_lengths = 1。