Kubernetes NodeLost / NotReady /高IO磁盘

时间:2018-05-23 03:05:16

标签: azure kubernetes acs azure-container-service

我遇到了一个非常复杂的问题,Kubernetes在我的生产环境中丢失了所有代理节点,他们从Ready更改为NotReady,所有pod都从Running更改为NodeLost状态。我发现Kubernetes正在大量使用磁盘:

Agent Node Usage

Agent Node Usage 2

Kubectl get nodes

enter image description here

我的集群使用acs-engine 0.17.0进行部署(我也测试过以前的版本,同样的情况也是如此)。

另一方面,我们决定部署包含Premium磁盘的Standard_DS2_VX VM系列,并且我们将IOPS增加到2000(之前低于500 IOPS)并且发生了同样的事情。我现在要尝试更高的数字。

任何有关这方面的帮助都会被证实。

1 个答案:

答案 0 :(得分:0)

这是一种微服务,它在消耗资源,然后Kubernetes只是停止了节点。我们已经在建立基于资源/限制的工作,从而可以避免整个集群中断。