在GCE中,如何防止Pod在节点上发生故障后调度到该节点?

时间:2019-03-05 15:26:43

标签: google-kubernetes-engine

我有一个设置,在pod和节点之间具有1:1的映射,其中每个节点都有一个本地ssd,每个pod都将自定义数据写入该ssd。如果吊舱不正常地死亡,则可能会使本地ssd处于无法安装其他吊舱的状态。

我正在计划使用群集自动缩放,因此我的想法是,如果可以阻止在节点上计划容器,GCE将删除该节点并创建一个新的干净节点吗?我该如何防止节点安排新节点?

1 个答案:

答案 0 :(得分:1)

我将运行一个计划的任务(可能是cronjob)来检查音量状态。如果voulme已损坏-将label添加到节点-(例如-volume-state=corrupted

通过nodeAffinity-requiredDuringSchedulingRequiredDuringExecution和标签上的nodeSelector来安排您的Pod

  

它将从不再满足Pod的节点亲和力要求的节点上驱逐Pod。