如何获得多个完全匹配词组

时间:2020-07-13 12:53:20

标签: elasticsearch dsl elasticsearch-dsl

下面是获取完全匹配的查询

GET courses/_search
{
  "query": {
    "term" : {
         "name.keyword": "Anthropology 230"
      }
  }
}

我需要找到Anthropology 230Anthropology 250 also

如何获得完全匹配

3 个答案:

答案 0 :(得分:5)

您所做的错误是您在关键字字段上使用了术语查询,并且没有对这两个查询都进行分析,这意味着他们试图在倒排索引中找到完全相同的搜索字符串。

您应该做的是:定义一个text字段,如果您尚未定义映射,则该字段将一直存在。我还假设与您提到的.keyword查询相同,如果您未定义映射,则会自动创建。

现在,您只需在下面进行分析的match query下使用并使用standard analyzer即可在空白处分割标记,因此Anthropology 250230为您的2个示例文档生成的。

简单高效的查询,同时带来了两个文档

{
    "query": {
        "match" : {
            "name" : "Anthropology 230"
        }
    }
}

和搜索结果

 "hits": [
      {
        "_index": "matchterm",
        "_type": "_doc",
        "_id": "1",
        "_score": 0.8754687,
        "_source": {
          "name": "Anthropology 230"
        }
      },
      {
        "_index": "matchterm",
        "_type": "_doc",
        "_id": "2",
        "_score": 0.18232156,
        "_source": {
          "name": "Anthropology 250"
        }
      }
    ]

上述查询与两个文档匹配的原因是,它创建了两个令牌anthropology230,并且在两个文档中都匹配了anthropology

您绝对应该阅读analysis process的知识,也可以尝试analyze API查看为任何文本生成的标记。

分析文本的API输出

POST http:// {{hostname}}:{{port}} / {{index-name}} / _analyze

{
  "analyzer": "standard",
  "text": "Anthropology 250"
}


{
    "tokens": [
        {
            "token": "anthropology",
            "start_offset": 0,
            "end_offset": 12,
            "type": "<ALPHANUM>",
            "position": 0
        },
        {
            "token": "250",
            "start_offset": 13,
            "end_offset": 16,
            "type": "<NUM>",
            "position": 1
        }
    ]
}

答案 1 :(得分:3)

您可以检查并尝试使用matchmatch_phrasematch_phrase_prefix

使用匹配

GET courses/_search
{
    "query": {
        "match" : {
            "name" : "Anthropology 230"
        }
    },
    "_source": "name"
}

使用 match_phrase

GET courses/_search
{
    "query": {
        "match_phrase" : {
            "name" : "Anthropology"
        }
    },
    "_source": "name"
}

OR ,使用regexp

GET courses/_search
{
    "query": {
        "regexp" : {
            "name" : "Anthropology [0-9]{3}"
        }
    },
    "_source": "name"
}

答案 2 :(得分:2)

假设您可能有更多的“人类学nnn”项目,这应该可以满足您的需求:

"query":{
    "bool":{
        "must":[
            {"term": {"name.keyword":"Anthropology 230"}},
            {"term": {"name.keyword":"Anthropology 250"}},
        ]  
    }
}
相关问题