在搜索查询中为术语分配权重的弹性如何?

时间:2019-05-17 02:00:40

标签: elasticsearch tf-idf

我经历了Theory behind relevance scoring,并提出了一个问题,但在Google上找不到答案

我的问题在链接的下面部分

  

想象一下,我们有一个查询“快乐河马”。   像快乐这样的人体重很轻,而像   河马体重会很高。假设快乐有一个   重2,河马重5。

elastic如何确定查询中每个单词的权重?弹性在字典中是否对每个单词都有预定义的权重

更新:-

看看链接中的图28,我看到了四行。我了解每个文档对应的3条蓝线。这些蓝线代表 每个单词/术语(查询中的单词)相对于每个文档的权重。我的问题是绿线。如何绘制(此处已计算重量)?

1 个答案:

答案 0 :(得分:0)

为每个文档中的每个单词计算权重。它基于术语频率,逆文档频率和字段长度范数。参见this section of the page you mentioned