当Pod数量很高时,Kubernetes仪表板不响应

时间:2018-10-30 08:18:27

标签: amazon-ec2 kubernetes kops kubernetes-dashboard

Kubernetes仪表板在使用Deployment计划大量Pod(超过1000个)之前可以正常工作。

当运行许多Pod时,尝试单击仪表板中的任何页面时出现以下错误:
Error: 'dial tcp <ip>:9090: getsockopt: connection refused' Trying to reach: 'http://<ip>:9090/api/v1/workload/default?itemsPerPage=10&page=1'

增加主节点的规格是否有帮助?

我认为主节点无法处理网络负载?

更新
可能是相关的,但是我不确定,当我在许多中型实例而不是一些非常大的实例上运行群集(我正在使用kops)时,此问题是减少了(减少了此错误页面)。
似乎每个节点上的Pod控制器(或您所说的任何一个)都无法处理这么多的Pod,因为规格非常高的Node上有许多Pod,而中型节点上安排的Pod则更少。

1 个答案:

答案 0 :(得分:1)

绝对看起来kubernetes-dashboard pod缺少资源。可能的解决方案是在专用节点上或在资源消耗较少的节点上运行kubernetes-dashboard pod。

TaintsAffinity功能可能有助于实现这一目标。