Elasticsearch中索引的新方法

时间:2017-04-19 09:14:54

标签: elasticsearch

我想在Elasticsearch中定义一种新的索引方法,所以我将编辑tf idf方法。 哪里可以找到TF-IDF elasticsearch实现? 我需要操作以实现新方法的elasticsearch源代码中的包是什么?

1 个答案:

答案 0 :(得分:1)

TF / IDF相似度算法在Lucene中实现,但是,有一些方法可以通过similarity module定义另一个在Elasticsearch中使用的相似性算法。除TF / IDF外,目前还支持7 more similarities

  • BM25
  • 经典相似度
  • DFR相似度
  • DFI相似度
  • IB相似度
  • LM Dirichlet相似性
  • LM Jelinek Mercer的相似性

每个参数都有不同的参数可以调整。也许在尝试创建自己的之前测试每一个都是个好主意。

有关可用Lucene相似度算法的更多信息:https://lucene.apache.org/core/6_5_0/core/org/apache/lucene/search/similarities/Similarity.html