一段时间后,我的kubernetes群集无法正常工作

时间:2019-03-26 06:52:47

标签: kubernetes

我有kubernetes个集群。一切正常。但是当我运行kubectl get pods 8天后,它显示:

The connection to the server <host>:6443 was refused - did you specify the right host or port?

我只有一位主人和一位工人。 我在没有任何云的实验室中运行它们。

systemctl kubelet status
show **node not found**

我的 / etc / hosts 已检查并且正确

4 个答案:

答案 0 :(得分:1)

我缺少硬件。我运行此命令来解决问题

sudo -i
swapoff -a
exit
strace -eopenat kubectl version

答案 1 :(得分:0)

最有可能重启了服务器。我有类似的问题。 检查主服务器上的kubelet日志并采取措施。

如果您可以共享kubelet日志,那么我们将为您提供进一步的帮助

答案 2 :(得分:0)

重新启动本身不成问题-但是,如果您未禁用永久交换,重新启动将再次启用交换功能,并且API服务器将无法启动-可能是第一次尝试。

第二个-检查可用磁盘空间,如果磁盘已满,API服务器将不响应(将引发磁盘压力事件并尝试逐出Pod)。

如果这样做没有帮助-请添加来自Kubelet的日志(systemctl和journalctl)。

答案 3 :(得分:0)

验证/ var / log / messages以获得有关该错误的更多信息

systemctl状态小方块

或者journalctl也将显示详细信息。