我正在探索elastic
R包来向ElasticSearch写一个数据框。
我正在使用docs_bulk
函数。
我的数据框中的一列是 @timestamp ,其格式为POSIXct
。
但该字段在弹性搜索中以字符串形式保存。
关于如何以时间格式保存列的任何想法。
我也试过通过手动创建具有正确数据类型定义的索引映射,但它不起作用。
请建议。
版本:
R:3.3.1
弹性搜索 - 2.4.1
操作系统 - Redhat
答案 0 :(得分:2)
elastic
不会尝试从输入data.frame或列表中捕获数据类型到docs_bulk()
- 我们可以考虑尝试这样做,但我想R数据类型不会映射完全符合Elasticsearch类型 - 可能会尝试映射数据类型。我就是这样做的:
library('elastic')
connect()
Dummy data.frame
df <- data.frame(
date = as.POSIXct(seq(from = as.Date("2016-10-01"),
to = as.Date("2016-10-31"), by = 'day')),
num = 1:31
)
以列表或JSON字符串
创建映射mapping <- list(
world = list(properties = list(
date = list(
type = "date",
format = "yyyy-mm-dd HH:mm:ss"
),
num = list(type = "long")
)))
制作索引
index_create(index = "hello")
在索引中创建映射
mapping_create(index = "hello", type = "world", body = mapping)
获取映射
mapping_get("hello")
#> $hello
#> $hello$mappings
#> $hello$mappings$world
#> $hello$mappings$world$properties
#> $hello$mappings$world$properties$date
#> $hello$mappings$world$properties$date$type
#> [1] "date"
#>
#> $hello$mappings$world$properties$date$format
#> [1] "yyyy-mm-dd HH:mm:ss"
#>
#>
#> $hello$mappings$world$properties$num
#> $hello$mappings$world$properties$num$type
#> [1] "long"
批量加载data.frame
docs_bulk(df, index = "hello", type = "world")
搜索索引
Search("hello")