使用数组作为搜索输入的Elasticsearch查询

时间:2019-03-23 15:17:29

标签: python elasticsearch

我正在尝试使用字符串数组作为搜索输入来查询某些索引数据。

索引数据如下:

{
  "pubMedID": "21528671",
  "title": "Basic fibroblast [...] melanoma cells.",
  "abstract": "Human malignant [...] cell growth."
}

我想在“标题”和“抽象”字段中搜索多个字符串。例如:

queryString=['melanoma', 'dysplastic nevus syndrome']

我已经尝试使用以下代码:

queryString=['melanoma', 'dysplastic nevus syndrome']

payload={
  "query": {
    "bool": {
      "should": [
        {
          "query_string": {
            "query": queryString,
            "fields": [
              "title",
              "abstract"
            ]
          }
        }
      ]
    }
  }
}


payload_json = (json.dumps(payload))
res = esclient.search(index='medicine',body=payload_json)

但是运行此程序时出现以下错误:

RequestError: RequestError(400, 'parsing_exception', '[query_string] query does not support [query]')

如果我只输入一个简单的字符串值,查询就可以正常工作。有人可以告诉我在输入数组时我应该如何进行这种查询吗?预先谢谢你!

1 个答案:

答案 0 :(得分:1)

编辑:

我对query_string查询有点不熟悉,但事实证明您也可以使用它来做类似的事情:

qs = ''
for q in queryStrings:
  if qs:
    qs += ' OR '
  qs += q

payload={
  "query": {
    "bool": {
      "should": [
        {
          "query_string": {
            "query": qs,
            "fields": [
              "title",
              "abstract"
            ]
          }
        }
      ]
    }
  }
}

结果将是类似于下面概述的多重子句的查询。

文档在这里:https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-query-string-query.html

原始:

这可以通过多个子句来实现,例如:

queryString=['melanoma', 'dysplastic nevus syndrome']

payload={
  "query": {
    "bool": {
      "should": [
        {
          "query_string": {
            "query": queryString[0],
            "fields": [
              "title",
              "abstract"
            ]
          }
        },
        {
          "query_string": {
            "query": queryString[1],
            "fields": [
              "title",
              "abstract"
            ]
          }
        }
      ]
    }
  }
}

如果查询数量可变,则只需要动态构建诸如以下内容的“ should”子句即可:

shoulds = []
for q in queryStrings:
   shoulds.append({
      "query_string": {
        "query": q,
        "fields": [
          "title",
          "abstract"
        ]
      }
    })

payload={
  "query": {
    "bool": {
      "should": shoulds
    }
  }
}