重新启动后我的kubernetes群集已关闭

时间:2019-04-07 05:44:55

标签: kubernetes bare-metal-server

每次重新启动后,我的kubernetes群集无法正常工作,我得到

The connection to the server 192.168.1.4:6443 was refused - did you specify the right host or port?

我在 baremetal 上有4个ubuntu,其中之一是master和3个worker,我关闭交换并禁用它。 我读过某个地方,我应该运行此命令,两个命令可以解决

sudo -i
swapoff -a
exit
strace -eopenat kubectl version

这是工作。 但是为什么会这样呢?

2 个答案:

答案 0 :(得分:0)

Kubelet很可能没有重新启动。您需要检查Kubelet日志是否更正了这些问题。

检查docker驱动程序和kubelet使用的驱动程序应该相同。

应该禁用交换,依此类推

答案 1 :(得分:0)

首先请运行systemctl status kubelet并验证服务是否正在运行:
活动:活动(正在运行)
禁用交换:

sudo swapoff -a
sudo sed -i '/ swap / s/^\(.*\)$/#\1/g' /etc/fstab

验证在 / etc / fstab 中找到的有关交换的所有参考。

也请按照以下说明为当前用户发布“ kubeadm init”步骤: https://kubernetes.io/docs/setup/independent/create-cluster-kubeadm/

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

重新启动后,请检查:
systemctl status docker 如果无法运行,请在启动时启用docker
systemctl enable docker

您还可以验证kubelet的状态:

systemctl status kubelet
systemctl enable kubelet

看看是否有任何错误:

journalctl -u kubelet.service
journalctl

请分享您的发现。