Elasticsearch中的BM25相似性调整

时间:2014-12-05 01:22:44

标签: elasticsearch

Elasticsearch documentation says我可以通过将以下内容添加到elasticsearch.yml来更改所有字段的相似性:

index.similarity.default.type: BM25

..我已经完成了,但我也希望微调字段长度规范化,它说我可以在这里做: http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/pluggable-similarites.html#bm25-tunability

但它没有告诉我在哪里/如何设置k1b参数。我可以添加一行elasticsearch.yml来实现这一目标吗?

感谢。

2 个答案:

答案 0 :(得分:3)

您可以查看此document,了解如何配置BM25相似性

基本上,您可以在索引设置

中定义类似于自定义分析器的自定义bm25相似度

示例:

 curl -XPUT "http://<server>/<index>" -d '
{
  "settings": {
    "similarity": {
      "custom_bm25": { 
        "type": "BM25",
        "b":    0 ,
         "k1" : 0.9

      }
    }
  }'

答案 1 :(得分:1)

这是我的elasticsearch.yml文件的样子。这是使用elasticsearch-2.3.2。

index :
  similarity:
    default:
      type: BM25
      b: 0.75
      k1: 1.2

此外,here是选择调整参数的一个很好的参考。