我有一个带有一些可怕的错误软件的吊舱。 Kubernetes非常棒的一个原因是,当它崩溃时它会重新启动软件,这很棒。
Kubernetes专为优秀的软件设计,而不是糟糕的软件,因此在重启pod时会进行指数退避。这意味着在我的pod重新启动之前,我必须在崩溃之间等待五分钟。
有没有办法限制kubernetes退避策略?我想将它更改为不再等待超过30秒再次启动pod。
答案 0 :(得分:8)
不幸的是,容器重启的最大后退时间对于节点可靠性是不可调的(即,太多容器重启可能使节点不堪重负)。如果您绝对想在群集中更改它,则需要modify the max backoff time in the code,编译自己的kubelet二进制文件,并将其分发到您的节点上。