Question

我知道，弹性搜索在计算查询检索到的文档的分数时会考虑字段的长度。场越短，重量越高（见The field-length norm）。

我喜欢这种行为：当我搜索iphone时，我对iphone 6比对Crappy accessories for: iphone 5 iphone 5s iphone 6更感兴趣。

现在，我想尝试提升这些东西，让我们说我想要加倍它的重要性。

我知道可以使用function score修改分数，我想我可以通过script score实现我想要的目标。

我试图在这个分数中添加另一个字段长度的规范：

    {
     "query": {
       "function_score": {
         "boost_mode": "replace",
         "query": {...},
         "script_score": {
             "script": "_score + norm(doc)"
         }
       }
     }
   }

但我失败了，得到了这个错误：[No parser for element [function_score]]

编辑：

我的第一个错误是我没有在“查询”中包含功能得分。现在我编辑了上面的代码。我的新错误说

GroovyScriptExecutionException[MissingMethodException
[No signature of method: Script5.norm() is applicable for argument types:
(org.elasticsearch.search.lookup.DocLookup) values: 
[<org.elasticsearch.search.lookup.DocLookup@2c935f6f>]
Possible solutions: notify(), wait(), run(), run(), dump(), any()]]

编辑：我提供了第一个答案，但我希望能有更好的答案

Answer 1

看起来您可以使用type token_count字段和field_value_factor function score来实现这一目标。

所以，在字段映射中这样的事情：

"name": { 
  "type": "string",
  "fields": {
    "length": { 
      "type":     "token_count",
      "analyzer": "standard"
    }
  }
}

这将使用字段中的令牌数量。如果要使用字符数，可以将分析器从standard更改为用于标记每个字符的自定义分析器。

然后在查询中：

"function_score": {
  ...,
  "field_value_factor": {
    "field": "name.length",
    "modifier": "reciprocal"
  }
}

Answer 2

我有一些有用的东西。通过以下内容，我从分数中扣除了我感兴趣的字段的长度。

{
 "query": {
   "function_score": {
     "boost_mode": "replace",
     "query": {...},
     "script_score": {
         "script": "_score  - doc['<field_name>'].value.length()"
     }
   }
 }
}

Hovever，与旧的分数相比，我无法控制这个我减去的数字的相对权重。这就是为什么我不接受我的答案：我会暂时等待更好的答案。理想情况下，我希望有机会访问script_score中的field length norm函数，或者获得相同的结果。

如何在弹性搜索函数得分中提高字段长度范数？

2 个答案: