ElasticSearch查询以获取平面文件或索引转储

时间:2019-01-08 16:53:25

标签: elasticsearch

我们在Azure云中的Linux上有一个ElasticSearch实例。我们正在尝试以编程方式在指定时间每24小时获取一次ElasticSearch索引的平面文件或转储(格式可协商),然后将其交付给没有ElasticSearch的客户。该文件的大小约为15GB,其中包含约700万个文档。

我们认为我们需要从对我们的ElasticSearch实例的查询开始,该查询实际上会获取数据,但是,通过我对文档的仔细研究,我看不到要实现此目的的查询。

有人知道这种查询或实现这种查询的方法吗?除了查询之外,还需要考虑文件的大尺寸,并且需要考虑该文件才能实现正确的解决方案。

编辑:我添加了一些其他相关信息,这些信息在第一篇文章中并不明显,可能会使答案略有不同。

1 个答案:

答案 0 :(得分:1)

除了Val提到的一种可能性是使用snapshot functionality

快照是从正在运行的Elasticsearch集群中获取的备份。您可以拍摄单个索引或整个群集的快照,并将其存储在共享文件系统上的存储库中,并且有些插件支持S3,HDFS,Azure,Google Cloud Storage等上的远程存储库。

稍后,可以在同一群集或新群集上还原此快照(如果打算将其用作备份或故障转移机制)