目前,我已经在ElasticSearch中索引了很多文档,当我搜索最高分时,这个数字超过了1.
如何获得介于0和1之间的相似性搜索?
我应该更好地配置ElasticSearch吗?或者我应该改变我的映射?
提前感谢您的建议。
答案 0 :(得分:1)
Lucene评分不是基于tif id向量的经典余弦相似函数,但是一些修改考虑了其他因素,如字段上的提升或查询项。您可以在page阅读有关评分公式的模式详细信息。因此,获得0.0和1.0之间得分的最简单方法,就是来自elasticsearch响应的max_score上的标准得分(它与第一个文档的得分一致)。