Elasticsearch模糊比率四舍五入

时间:2014-09-01 01:45:22

标签: elasticsearch

使用匹配查询搜索字符串时,如果fuzziness作为分数给出,则容忍的错误数将基于输入令牌'长度,根据以下公式:length(term) * (1.0 - fuzziness)(参见Elasticsearch documentation

我的问题是,当计算值为非整数时,它会向上舍入还是向下舍入?

1 个答案:

答案 0 :(得分:0)

经过进一步调查,似乎总是向下舍入

阅读explain的输出,同时运行查询以匹配portobellos,这给了我一些见解。

  • 如果输入查询为portobelloX,则相似度值为0.9090909(我猜它是从1 - 1/11开始)
  • 当输入为portobellXX时,相似度得分为0.8181818(再次,1 - 2/11)

如果我设置模糊度为0.85,则运行第二个查询将不会返回结果,可能是因为相似度得分低于0.85。