我最近有一个SNAFU导致我的群集最终出现裂脑(尽管有许多控制措施)导致碎片基本上被破坏。我已经让所有节点恢复正常,识别正确的主人等等,但是群集仍然是红色的,这是正确的;有一些没有家的碎片。
使用我的RubberBand script后,我能够使用VisualJSON来查找没有节点的分片,如下所示:
{
"index": "logstash-2013.12.27",
"node": null,
"primary": false,
"relocating_node": null,
"shard": 4,
"state": "UNASSIGNED"
},
我想删除它们,但我似乎无法找到删除分片的API调用,只删除整个索引或使用查询。提前谢谢!
答案 0 :(得分:7)
curl -XPOST 'localhost:9200/_cluster/reroute' -d '{
"commands": [
{
"allocate": {
"index": "tweedle-2013.12.21",
"shard": 3,
"node": "efsKb4DzQ2iaIfKfu36vsA",
"allow_primary": true
}
}
]
}'
此命令将采用孤立的分片并将其分配给节点efsKb4DzQ2iaIfKfu36vsA
在一行:
curl -XPOST 'localhost:9200/_cluster/reroute' -d '{
"commands": [
{
"allocate": {
"index": "tweedle-2013.12.21",
"shard": 3,
"node": "efsKb4DzQ2iaIfKfu36vsA",
"allow_primary": true
}
}
]
}'
答案 1 :(得分:0)
您无法删除未分配的分片,因为没有要删除的分片。未分配的分片是不是损坏的分片,而是丢失的副本。
您的配置可能告诉ES(ElasticSearch)创建副本并将其分配到不同的节点上,以实现高可用性和/或容错能力。 ES无法自动创建和分配副本,因此您看到了UNASSIGNED
状态。可能是由于网络错误,内存不可用等。
您可能想找出分配失败的原因:
curl -XPOST 'localhost:9200/_cluster/allocation/explain?pretty'
然后,要求ES retry the allocation for you:
curl -XPOST 'localhost:9200/_cluster/reroute?retry_failed'
向ES专家answer致谢,
在尝试5次分配失败后,主机放弃并需要手动触发才能再次尝试分配