在Elasticsearch中查找最相似的文档

时间:2019-08-27 20:24:20

标签: elasticsearch nlp sentence-similarity

如何在Elasticsearch中找到两个索引之间最相似的前100个文档?

文档#1在index1中,类型11,字段111。 文档#2在index2中,类型21,字段211

编辑:两个字段都是字符串。

我查看了More Like This query的文档。但这并没有告诉我如何快速比较不同种类相似性指标的结果并查看最高结果。

1 个答案:

答案 0 :(得分:0)

尝试执行此查询,但将ID值替换为您的文档:

GET index1,index2/_search
{
  "query": {
    "more_like_this": {
      "fields": [
        "field111",
        "field211"
      ],
      "like": [
        {
          "_index": "index1",
          "_id": "DOC_1_ID"
        },
        {
          "_index": "index2",
          "_id": "DOC_2_ID"
        }
      ],
      "min_term_freq": 1,
      "max_query_terms": 12
    }
  }
}