为什么kubernetes在CPU使用率很高时会产生多个错误?

时间:2017-07-16 12:11:36

标签: kubernetes kubectl kubelet

我使用Kubernetes和GKE(一个节点),这是非常好用的。 但是,我遇到了多个错误,导致所有播客都没有响应:

  • kubectl exec命令:来自服务器的错误:错误拨号后端:ssh:被拒绝:连接失败(连接被拒绝)
  • 来自nginx-ingress控制器的日志:service staging / myservice没有任何活动端点
  • kubectl top nodes:来自服务器的错误(InternalError):服务器上的错误("未知")阻止请求成功(获取服务http:heapster:)

当CPU使用率很高时(100%或几乎,由于我的情况下并行Jenkins构建),会发生这种情况。

我为少数pod设置了一些资源请求和限制(有时两者),但即使这些pod也无法访问,并且在某一时刻,它们会重新启动。原因几乎总是"已完成",退出代码为0,几次"错误"使用不同的退出代码(例如,2,137,255)。

我还注意到来自复制控制器的这个错误:错误同步pod,跳过:网络未就绪:[运行时网络未就绪:NetworkReady = false原因:NetworkPluginNotReady消息:docker:网络插件尚未就绪:Kubenet没有netConfig。这很可能是由于缺少PodCIDR]

Kubernetes通常允许通过群集保持服务的可用性。

我们如何解释这种行为?推荐的预防方法是什么?

0 个答案:

没有答案