我实际上想知道,我们如何根据经验验证或评估BM25公式中b和k1的值?换句话说,最“科学”的评价是什么?
我们可以参考哪些研究论文,以了解这类评估是如何完成的?
答案 0 :(得分:2)
这些BM25参数的最佳值非常依赖于您的数据收集。阅读:Pluggable Similarity Algorithms | Elasticsearch
调整参数的一种简单方法是调整它们,然后评估它们对性能的影响。如果结果不满意,请再次更改参数并评估结果。它可以通过遗传算法或ACO等元启发式算法实现自动化。
也有一些论文可供选择: