提升的标准化和内部优化如何工作?这对相关性有何影响?

时间:2017-09-13 06:00:51

标签: elasticsearch elasticsearch-5 relevance boosting

我是弹性搜索的新手。我无法理解文档中字段的提升值的校准和缩放。因为我们应该如何决定字段的提升值,以便它按预期工作。我已经浏览了一些在线博客和es doc,它写的是es的标准化和内部优化提升价值?这有什么作用?

例如:如果我们的文档中有标签,标题,名称和文本字段,我们应该如何确定这些的提升值?

1 个答案:

答案 0 :(得分:0)

Elasticsearch使用布尔模型匹配文档,然后使用评分模型来确定相关性(即排名)。评分模型使用TF / IDF评分,并附加一些额外功能。针对查询中的每个匹配字段计算那些TF / IDF分数,然后将其聚合以产生文档的总分。要深入了解此过程,我建议您在查询中运行explain,以了解每个字段的得分如何影响文档的整体相关性。

作为您数据的专家,您最有能力确定哪些字段应该最重要地影响您的文档的相关性。找到一个字段的正确增值值是关于调整杠杆,直到找到最符合您期望结果的公式(另外,如果您有用户,A / B测试可以在这里帮助)。