在文件Elasticsearch 1.7中获取索引的所有文档

时间:2019-01-07 11:11:52

标签: json elasticsearch bigdata search-engine elasticsearch-5

我在1.7版的elasticsearch中有一个大小为25 GB的索引,并且我想将其升级到ES 5.5。但是由于文档具有1.7版本支持的空字段名称(字符串),而5.5版本不支持,因此我想用null值替换所有空字符串。

由于其他人已为数据建立索引,所以我不知道是否能够找到源,以便可以解决此问题并再次为数据建立索引。但是由于数据已经被索引了,有什么方法可以在.json文件中检索索引的所有文档,可以用来修复错误并再次建立索引?

例如-检索bulk.json中的所有文档,然后使用ES 5.5版本中的常规post请求再次为其建立索引。

我尝试了几种方法,还研究了this,但没有找到可以在单个bulk.json

中存储所有25 GB文档的内容。

请让我知道是否还有其他方法可以解决此问题。

1 个答案:

答案 0 :(得分:1)

使用ElasticDump,它将很简单

npm install elasticdump

然后

elasticdump \
    --input=http://production.es.com:9200/my_index \
    --output=/data/my_index_data.json \
    --type=data