Elasticsearch documentation says我可以通过将以下内容添加到elasticsearch.yml
来更改所有字段的相似性:
index.similarity.default.type: BM25
..我已经完成了,但我也希望微调字段长度规范化,它说我可以在这里做: http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/pluggable-similarites.html#bm25-tunability
但它没有告诉我在哪里/如何设置k1
和b
参数。我可以添加一行elasticsearch.yml
来实现这一目标吗?
感谢。
答案 0 :(得分:3)
您可以查看此document,了解如何配置BM25相似性
基本上,您可以在索引设置
中定义类似于自定义分析器的自定义bm25相似度示例:
curl -XPUT "http://<server>/<index>" -d '
{
"settings": {
"similarity": {
"custom_bm25": {
"type": "BM25",
"b": 0 ,
"k1" : 0.9
}
}
}'
答案 1 :(得分:1)
这是我的elasticsearch.yml文件的样子。这是使用elasticsearch-2.3.2。
index :
similarity:
default:
type: BM25
b: 0.75
k1: 1.2
此外,here是选择调整参数的一个很好的参考。