如何读取Elasticsearch快照

时间:2019-05-16 15:36:08

标签: java python amazon-web-services elasticsearch

我想将我的Elasticsearch集群的内容复制到我的数据湖中以进行连接。目前,我正在进行此购买,每小时扫描一次整个索引,并从中构建新的镶木地板。此过程缓慢,昂贵,并且在群集中进行剪贴时很困难。

我想让Elasticsearch创建快照更容易,那就是让许多客户端并行进行扫描调用。因此,我想制作一个索引快照,在许多工作人员中水平分割索引,并让这些工作人员生产镶木地板。

问题是我的群集由aws的elasticsearch服务托管,该服务不提供纯文本快照。我不知道如何读取标准快照格式而不将其加载到另一个Elasticsearch集群中。我希望能够从水平伸缩工作池中的简单python或java进程读取快照。

是否可以在没有将ElasticSearch快照加载到Elasticsearch的情况下读取它?

1 个答案:

答案 0 :(得分:0)

es快照,读取必须加载数据,还可以将数据文件复制到新的es的数据路径,es可以自动加载数据

PUT _snapshot/my_backup 
{
    "type": "fs", 
    "settings": {
        "location": "/mount/backups/my_backup" 
    }
}