我想将我的Elasticsearch集群的内容复制到我的数据湖中以进行连接。目前,我正在进行此购买,每小时扫描一次整个索引,并从中构建新的镶木地板。此过程缓慢,昂贵,并且在群集中进行剪贴时很困难。
我想让Elasticsearch创建快照更容易,那就是让许多客户端并行进行扫描调用。因此,我想制作一个索引快照,在许多工作人员中水平分割索引,并让这些工作人员生产镶木地板。
问题是我的群集由aws的elasticsearch服务托管,该服务不提供纯文本快照。我不知道如何读取标准快照格式而不将其加载到另一个Elasticsearch集群中。我希望能够从水平伸缩工作池中的简单python或java进程读取快照。
是否可以在没有将ElasticSearch快照加载到Elasticsearch的情况下读取它?
答案 0 :(得分:0)
es快照,读取必须加载数据,还可以将数据文件复制到新的es的数据路径,es可以自动加载数据
PUT _snapshot/my_backup
{
"type": "fs",
"settings": {
"location": "/mount/backups/my_backup"
}
}