禁用IDF计算

时间:2014-01-19 20:53:07

标签: elasticsearch

在我的特定用例中,作为TF-IDF算法的一部分计算的IDF因子会弄乱我的查询得分。基本上,我希望查询只考虑术语频率。对于特定索引,是否可以禁用IDF因子,即将其设置为1?我已经查看了相似性模块(版本0.90.X),但还没有找到任何可以帮助的东西;同样适用于function_score查询。我是否需要在java中编写自定义的Similarity类?或者是否有我想要实现的插件?

1 个答案:

答案 0 :(得分:1)

constant_score查询怎么样?

请参阅http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/ignoring-tfidf.html

请不要犹豫使用?explain = true来了解评分是如何运作的。

正如你可以在没有constant_filter的情况下那样:

With IDF

使用constant_filter查询(包装您的真实查询):

Without IDF