我遇到了一个非常复杂的问题,Kubernetes在我的生产环境中丢失了所有代理节点,他们从Ready更改为NotReady,所有pod都从Running更改为NodeLost状态。我发现Kubernetes正在大量使用磁盘:
我的集群使用acs-engine 0.17.0进行部署(我也测试过以前的版本,同样的情况也是如此)。
另一方面,我们决定部署包含Premium磁盘的Standard_DS2_VX VM系列,并且我们将IOPS增加到2000(之前低于500 IOPS)并且发生了同样的事情。我现在要尝试更高的数字。
任何有关这方面的帮助都会被证实。
答案 0 :(得分:0)
这是一种微服务,它在消耗资源,然后Kubernetes只是停止了节点。我们已经在建立基于资源/限制的工作,从而可以避免整个集群中断。