Sphinx默认排名SPH_RANK_PROXIMITY_BM25
的公式如下:
SPH_RANK_PROXIMITY_BM25 = sum(lcs*user_weight)*1000+bm25
分别为每个字段计算最长公共子序列,然后乘以user_weight
。但是bm25
只是文档范围的变量,并未考虑用户字段。为什么会这样?
答案 0 :(得分:1)
仅因为它速度更快,并且在许多情况下质量就足够了。这里有一个自定义的等级和bm25f。默认情况下,文档长度也不作说明,在索引编制过程中需要index_field_lengths = 1。