我想将Elasticsearch的默认相似性更改为BM25。
根据
http://www.elasticsearch.org/guide/en/elasticsearch/reference/1.4/index-modules-similarity.html
我只需将以下行添加到elasticsearch.yml文件
index.similarity.default.type: BM25
但是,BM25有两个我想设置的输入参数k1
和b
。
有谁知道如何设置这些参数?
答案 0 :(得分:1)
在索引的设置中,输入相似性设置,就像你要映射一样
PUT /your_index/?pretty=1
{
"settings": {
"similarity": {
"bm25-inverse-zero": {
"type": "BM25",
"b": 0
}
},
}
答案 1 :(得分:1)
我发现了一个非常好的页面,解释了参数的含义。它在这里:https://www.elastic.co/guide/en/elasticsearch/guide/current/pluggable-similarites.html
以下是该页面的摘录:
k1:此参数控制术语频率增加导致术语频率饱和的速度。默认值为1.2。值越低,饱和度越快,饱和度越低值越高。
b:此参数控制字段长度规范化应具有的效果。值0.0将完全禁用标准化,值1.0将完全标准化。默认值为0.75。