为什么人们
更新服务器后,我无法重新启动kubernetes。
Feb 6 10:34:26 chgvas99 kubelet: F0206 10:34:26.662744 27634 server.go:189] failed to load Kubelet config file /var/lib/kubelet/config.yaml, error failed to read kubelet config file "/var/lib/kubelet/config.yaml", error: open /var/lib/kubelet/config.yaml: no such file or directory
Feb 6 10:34:26 chgvas99 systemd: kubelet.service: main process exited, code=exited, status=255/n/a
Feb 6 10:34:26 chgvas99 systemd: Unit kubelet.service entered failed state.
Feb 6 10:34:26 chgvas99 systemd: kubelet.service failed.
我检查了目录,实际上没有 config.yaml 。我的节点上有相同的错误,我无法重新启动它们
服务器: 3.10.0-957.5.1.el7.x86_64
kubernetes:主要:“ 1”,次要:“ 13”,GitVersion:“ v1.13.3” GoVersion:“ go1.11.5”
答案 0 :(得分:0)
我建议使用runninng'kubeadm-init'重新初始化集群。另外,请确保您的“ / var”目录不完整。有关“ kubeadm init”命令的更多信息,请参见link。
答案 1 :(得分:0)
您正在使用kubeadm-/var/lib/kubelet/config.yaml
为空这一事实很可能与工作节点未加入集群有关。
这可能与网络问题有关,但请逐步尝试:
1)为工作节点创建有效令牌以加入集群:
运行:sudo kubeadm token create --print-join-command --v=5
,并确保您收到类似以下的输出命令:
kubeadm join <master-node-ip>:6443 --token aa334.. --discovery-token-ca-cert-hash sha256:..
2)在工作节点中运行提供的命令。
3)如果一切正常,请填充/var/lib/kubelet/config.yaml
,并且sudo systemctl status kubelet
的状态应该看起来不错。
4)如果出现错误-尝试使用--v=5
运行ame join命令-您可能会看到一些网络问题。
4.A)如果遇到类似dial tcp <master-ip>:6443: connect: no route to host
的错误-请确保您的节点之间有通信-从工作节点运行curl <master-node-ip>:6443
-您可能会得到相同的{{1 }}错误。
转到主节点并打开no route
(假设您正在使用安全的专用网络),然后再次尝试连接。
4.B)如果成功打开master中的端口,并且您能够从worker卷曲到master,则您应该收到来自API服务器的响应,例如:6443 port
。
5)如果Client sent an HTTP request to an HTTPS server
成功,但是您仍然遇到连接问题,请尝试:
5.A)比较主节点和工作节点的curl
文件-确保API服务器的IP是正确的。
5.B)确保已在所有节点.kube/config
上启用网桥联网模式。
5.C)确保您拥有calico,flannel或weave之类的SDN解决方案,并且您看到相关的kube系统pod正在运行:
sudo sysctl net.bridge.bridge-nf-call-iptables=1
6)如果没有任何效果,请尝试在工作节点上运行$kubectl -n kube-system get pods
NAME READY STATUS RESTARTS AGE
coredns-f9fd979d6-lpdlc 1/1 Running 2 7d12h
coredns-f9fd979d6-vcs7g 1/1 Running 2 7d12h
etcd-master-node-k8s 1/1 Running 2 7d12h
kube-apiserver-master-node-k8s 1/1 Running 2 7d12h
kube-controller-manager-master-node-k8s 1/1 Running 2 7d12h
kube-proxy-kh2lc 1/1 Running 2 7d12h
kube-proxy-lfmc4 1/1 Running 0 4m36s
kube-scheduler-master-node-k8s 1/1 Running 2 7d12h
weave-net-59r5b 2/2 Running 6 7d11h <-- Here
weave-net-c44d6 2/2 Running 1 4m36s <-- Here
。
答案 2 :(得分:0)
My Env:初始化集群时的 3 个主负载均衡器和前端负载均衡器
不得不调整我的负载均衡器并取出其他主节点和“kubeadm init”,问题消失了,可能是网络错误。
然后读取所有其他主节点。