我使用Kubernetes和GKE(一个节点),这是非常好用的。 但是,我遇到了多个错误,导致所有播客都没有响应:
当CPU使用率很高时(100%或几乎,由于我的情况下并行Jenkins构建),会发生这种情况。
我为少数pod设置了一些资源请求和限制(有时两者),但即使这些pod也无法访问,并且在某一时刻,它们会重新启动。原因几乎总是"已完成",退出代码为0,几次"错误"使用不同的退出代码(例如,2,137,255)。
我还注意到来自复制控制器的这个错误:错误同步pod,跳过:网络未就绪:[运行时网络未就绪:NetworkReady = false原因:NetworkPluginNotReady消息:docker:网络插件尚未就绪:Kubenet没有netConfig。这很可能是由于缺少PodCIDR]
Kubernetes通常允许通过群集保持服务的可用性。
我们如何解释这种行为?推荐的预防方法是什么?