无法加载kubelet配置文件

时间:2019-02-06 09:33:47

标签: kubernetes google-kubernetes-engine

为什么人们

更新服务器后,我无法重新启动kubernetes。

Feb  6 10:34:26 chgvas99 kubelet: F0206 10:34:26.662744   27634 server.go:189] failed to load Kubelet config file /var/lib/kubelet/config.yaml, error failed to read kubelet config file "/var/lib/kubelet/config.yaml", error: open /var/lib/kubelet/config.yaml: no such file or directory
Feb  6 10:34:26 chgvas99 systemd: kubelet.service: main process exited, code=exited, status=255/n/a
Feb  6 10:34:26 chgvas99 systemd: Unit kubelet.service entered failed state.
Feb  6 10:34:26 chgvas99 systemd: kubelet.service failed.

我检查了目录,实际上没有 config.yaml 。我的节点上有相同的错误,我无法重新启动它们

服务器: 3.10.0-957.5.1.el7.x86_64

kubernetes:主要:“ 1”,次要:“ 13”,GitVersion:“ v1.13.3”                GoVersion:“ go1.11.5”

3 个答案:

答案 0 :(得分:0)

我建议使用runninng'kubeadm-init'重新初始化集群。另外,请确保您的“ / var”目录不完整。有关“ kubeadm init”命令的更多信息,请参见link

答案 1 :(得分:0)

您正在使用-/var/lib/kubelet/config.yaml为空这一事实很可能与工作节点未加入集群有关。

这可能与网络问题有关,但请逐步尝试:

1)为工作节点创建有效令牌以加入集群:
运行:sudo kubeadm token create --print-join-command --v=5,并确保您收到类似以下的输出命令:

kubeadm join <master-node-ip>:6443 --token aa334.. --discovery-token-ca-cert-hash sha256:..

2)在工作节点中运行提供的命令。

3)如果一切正常,请填充/var/lib/kubelet/config.yaml,并且sudo systemctl status kubelet的状态应该看起来不错。

4)如果出现错误-尝试使用--v=5运行ame join命令-您可能会看到一些网络问题。

4.A)如果遇到类似dial tcp <master-ip>:6443: connect: no route to host的错误-请确保您的节点之间有通信-从工作节点运行curl <master-node-ip>:6443-您可能会得到相同的{{1 }}错误。
转到主节点并打开no route(假设您正在使用安全的专用网络),然后再次尝试连接。

4.B)如果成功打开master中的端口,并且您能够从worker卷曲到master,则您应该收到来自API服务器的响应,例如:6443 port

5)如果Client sent an HTTP request to an HTTPS server成功,但是您仍然遇到连接问题,请尝试:

5.A)比较主节点和工作节点的curl文件-确保API服务器的IP是正确的。

5.B)确保已在所有节点.kube/config上启用网桥联网模式。

5.C)确保您拥有calicoflannelweave之类的SDN解决方案,并且您看到相关的kube系统pod正在运行:

sudo sysctl net.bridge.bridge-nf-call-iptables=1

6)如果没有任何效果,请尝试在工作节点上运行$kubectl -n kube-system get pods NAME READY STATUS RESTARTS AGE coredns-f9fd979d6-lpdlc 1/1 Running 2 7d12h coredns-f9fd979d6-vcs7g 1/1 Running 2 7d12h etcd-master-node-k8s 1/1 Running 2 7d12h kube-apiserver-master-node-k8s 1/1 Running 2 7d12h kube-controller-manager-master-node-k8s 1/1 Running 2 7d12h kube-proxy-kh2lc 1/1 Running 2 7d12h kube-proxy-lfmc4 1/1 Running 0 4m36s kube-scheduler-master-node-k8s 1/1 Running 2 7d12h weave-net-59r5b 2/2 Running 6 7d11h <-- Here weave-net-c44d6 2/2 Running 1 4m36s <-- Here

答案 2 :(得分:0)

My Env:初始化集群时的 3 个主负载均衡器和前端负载均衡器

不得不调整我的负载均衡器并取出其他主节点和“kubeadm init”,问题消失了,可能是网络错误。

然后读取所有其他主节点。