如何在Elasticsearch结果中允许空值?

时间:2014-07-15 13:27:13

标签: null elasticsearch match minimum

我正在使用Elasticsearch搜索数据库中的记录。记录包含start_dateend_date字段,用户可以指定要检查的日期范围。记录的开始和结束日期必须都在指定的日期范围内。但是,某些记录只有start_date,因此end_date字段为null。我想要返回这些记录,只要start_date在范围内。

{
  "from": 0,
  "size": 20,
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "last_name": {
              "query": "Beach",
              "boost": 1.0,
              "analyzer": "standard",
              "fuzziness": 2.0
            }
          }
        }
      ],
      "should": [
        {
          "range": {
            "start_date.year": {
              "gte": "1800",
              "lte": 1900
            }
          }
        },
        {
          "range": {
            "end_date.year": {
              "gte": "1800",
              "lte": 1900
            }
          }
        }
      ],
      "minimum_should_match": 1
    }
  }
}

问题在于,因为只有一个日期字段需要匹配,所以当我有一个start_dateend_date的记录时,其中一个可能超出范围。我如何要求start_dateend_date都在范围内,但允许start_dateend_date值为空?

2 个答案:

答案 0 :(得分:1)

您可以尝试这样的事情:

{
 "from" : 0,
 "size" : 20,
 "query" : {
  "bool" : {
   "must" : [{
     "match" : {
      "last_name" : {
       "query" : "Beach",
       "boost" : 1.0,
       "analyzer" : "standard",
       "fuzziness" : 2.0
      }
     }
    }
   ],
   "should" : [{
     "bool" : {
      "must" : [{
        "range" : {
         "start_date.year" : {
          "gte" : "1800",
          "lte" : 1900
         }
        }
       }, {
        "range" : {
         "end_date.year" : {
          "gte" : "1800",
          "lte" : 1900
         }
        }
       }
      ]
     }
    }, {
     "bool" : {
      "must" : [{
        "range" : {
         "start_date.year" : {
          "gte" : "1800",
          "lte" : 1900
         }
        }
       }, {
        "constant_score" : {
         "filter" : {
          "missing" : {
           "field" : "end_date.year"
          }
         }
        }
       }
      ]
     }
    }, {
     "bool" : {
      "must" : [{
        "range" : {
         "end_date.year" : {
          "gte" : "1800",
          "lte" : 1900
         }
        }
       }, {
        "constant_score" : {
         "filter" : {
          "missing" : {
           "field" : "start_date.year"
          }
         }
        }
       }
      ]
     }
    }
   ],
   "minimum_should_match" : 1
  }
 }
}

想法是创建3种可能的情况:开始日期和结束日期都在范围内,或者开始日期在范围内,没有结束日期,或结束日期在范围内,没有开始日期。

答案 1 :(得分:1)

我通过将日期字段放在OR过滤器中解决了这个问题,因此在查询主体的其余部分之后,结果将被start_date或end_date过滤。

我想这可能会导致错误,如果两个字段都存在,但其中一个超出范围,在这种情况下,Rotem Hermon的回答听起来是个好主意。现在这已经解决了这个问题。