elasticsearch查询中的格式化日期(检索期间)

时间:2015-01-13 20:50:10

标签: java groovy elasticsearch

我有一个带有字段" aDate"的弹性搜索索引。 (以及许多其他字段)具有以下映射

"aDate" : {
        "type" : "date",
        "format" : "date_optional_time"
}

当我查询文档时,我得到的结果如

"aDate" : 1421179734000,

我知道这是epoch,内部java / elasticsearch日期格式,但我希望得到如下结果:

"aDate" : "2015-01-13T20:08:54",

我玩脚本

{  
 "query":{  
   "match_all":{  

   }
 },
 "script_fields":{  
   "aDate":{  
      "script":"if (!_source.aDate?.equals('null')) new java.text.SimpleDateFormat('yyyy-MM-dd\\'T\\'HH:mm:ss').format(new java.util.Date(_source.aDate));"
   }
 }
}

但是它给出了奇怪的结果(脚本基本上起作用,但是aDate是唯一返回的字段而_source缺少)。这看起来像

"hits": [{
        "_index": "idx1",
        "_type": "type2",
        "_id": "8770",
        "_score": 1.0,
        "fields": {
            "aDate": ["2015-01-12T17:15:47"]
        }
    },

如果可能,我更喜欢没有脚本的解决方案。

5 个答案:

答案 0 :(得分:7)

在Elasticsearch中运行查询时,您可以请求它返回原始数据,例如指定fields

curl -XGET http://localhost:9200/myindex/date-test/_search?pretty -d '
{
 "fields" : "aDate",
 "query":{  
   "match_all":{  

   }
 }
}'

将以您最初存储的格式为您提供日期:

{
  "_index" : "myindex",
  "_type" : "date-test",
  "_id" : "AUrlWNTAk1DYhbTcL2xO",
  "_score" : 1.0,
  "fields" : {
    "aDate" : [ "2015-01-13T20:08:56" ]
  }
}, {
  "_index" : "myindex",
  "_type" : "date-test",
  "_id" : "AUrlQnFgk1DYhbTcL2xM",
  "_score" : 1.0,
  "fields" : {
    "aDate" : [ 1421179734000 ]
  }

除非您使用脚本,否则无法更改日期格式。

curl -XGET http://localhost:9200/myindex/date-test/_search?pretty -d '
{  
 "query":{  
   "match_all":{ }
 },
 "script_fields":{  
   "aDate":{  
      "script":"use( groovy.time.TimeCategory ) { new Date( doc[\"aDate\"].value )  }"
   }
 }
}'

将返回:

{
  "_index" : "myindex",
  "_type" : "date-test",
  "_id" : "AUrlWNTAk1DYhbTcL2xO",
  "_score" : 1.0,
  "fields" : {
    "aDate" : [ "2015-01-13T20:08:56.000Z" ]
  }
}, {
  "_index" : "myindex",
  "_type" : "date-test",
  "_id" : "AUrlQnFgk1DYhbTcL2xM",
  "_score" : 1.0,
  "fields" : {
    "aDate" : [ "2015-01-13T20:08:54.000Z" ]
  }
}

要应用格式,请按以下方式添加:

"script":"use( groovy.time.TimeCategory ){ new Date( doc[\"aDate\"].value ).format(\"yyyy-MM-dd\")   }"

将返回"aDate" : [ "2015-01-13" ]

要显示T,您需要使用引号,但将其替换为等效的Unicode:

"script":"use( groovy.time.TimeCategory ){ new Date( doc[\"aDate\"].value ).format(\"yyyy-MM-dd\u0027T\u0027HH:mm:ss\") }"

返回"aDate" : [ "2015-01-13T20:08:54" ]


返回script_fields和source

在查询中使用 _source 指定要返回的字段:

curl -XGET http://localhost:9200/myindex/date-test/_search?pretty -d '
 {  "_source" : "name",
  "query":{
    "match_all":{ }
  },
  "script_fields":{
    "aDate":{
       "script":"use( groovy.time.TimeCategory ) { new Date( doc[\"aDate\"].value )  }"
    }
  }
 }'

将返回我的name字段:

"_source":{"name":"Terry"},
  "fields" : {
    "aDate" : [ "2015-01-13T20:08:56.000Z" ]
  }

使用星号将返回所有字段,例如:"_source" : "*",

"_source":{"name":"Terry","aDate":1421179736000},
  "fields" : {
    "aDate" : [ "2015-01-13T20:08:56.000Z" ]
  }

答案 1 :(得分:4)

LabOctoCat所述,Olly Cruickshank回答不再适用于弹性2.2。我将脚本更改为:

"script":"new Date(doc['time'].value)"

您可以根据this格式化日期。

答案 2 :(得分:0)

脚本编写它只会在提取行时计算答案。这很昂贵,并且使您无法在Elasticsearch中使用任何与日期相关的搜索功能。

你应该创建一个弹性搜索" date"插入之前的字段。看起来像是一个java Date()对象will do

答案 3 :(得分:0)

从5.0.0版本开始,es使用Painless作为脚本语言:link

尝试一下(在6.3.2中工作)

"script":"doc['aDate'].value.toString('yyyy-MM-dd HH:mm:ss')"

答案 4 :(得分:0)

感谢@Archon的建议。我以您的答案为指导,从Elasticsearch的datetime字段中删除了时间元素

{
    "aggs": {
        "grp_by_date": {
            "terms": {
                "size": 200,
                "script": "doc['TransactionReconciliationsCreated'].value.toString('yyyy-MM-dd')"
            }
        }
    }
}