在elasticsearch上查询最接近日期时间的文档的最佳方法是什么?

时间:2015-10-26 12:32:36

标签: datetime groovy elasticsearch

我需要检索具有最接近请求的地理位置和日期时间的文档,因此我不是要查找日期时间的匹配项,而是查找最接近的日期时间。我使用自定义脚本解决了它,但是我猜测可能有更好的方法,类似于我根据位置和距离过滤地理位置的方式。

这是我的代码(在python中):

query = {
        "query": {
            "function_score": {
                "boost_mode": "replace",
                "query": {
                    "filtered": {
                        "query" : {
                            "match_all" : {}
                        },
                        "filter" : {
                            "geo_distance" : {
                                "distance" : "10km",
                                "location" : json.loads(self.request.body)["location"]
                            }
                        }
                    }
                },
                "script_score": {
                    "lang": "groovy",
                    "script_file": "calculate-score",
                    "params": {
                        "stamp": json.loads(self.request.body)["stamp"]
                    }
                }
            }
        },
        "sort": [
                    {"_score": "asc"}
        ],
        "size": 1
    }

    response = requests.get('http://localhost:9200/meteo/meteo/_search', data=json.dumps(query))

自定义calculate-score.groovy脚本包含以下内容:

abs(new java.text.SimpleDateFormat("yyyy-MM-dd\'T\'HH:mm").parse(stamp).getTime() - doc["stamp"].date.getMillis()) / 60000

该脚本将分数作为文档日期时间与请求日期时间之间的绝对差值(

)返回。

还有其他方法可以达到这个目的吗?

1 个答案:

答案 0 :(得分:1)

您应该可以使用function_score来执行此操作。 您可以使用doucmentation中提到的衰减函数为更接近原始时间戳的文档提供更大的分数。以下是示例 其中scale=28800 mins20d

示例:

put test
put test/test/_mapping
{
    "properties": {
          "stamp": {
                  "type": "date",
                  "format": "dateOptionalTime"
               }
    }
}
put test/test/1
{
    "stamp":"2015-10-15T00:00"
}

put test/test/2
{
    "stamp":"2015-10-15T12:00"
}


post test/_search
{
   "query": {
      "function_score": {
         "functions": [
            {
               "linear": {
                   "stamp" : {
                        "origin": "now",
                        "scale": "28800m"
                   }
               }
            }
         ],
         "score_mode" : "multiply",
         "boost_mode": "multiply",
         "query": {
            "match_all": {}
         }
      }
   }
}