Question

为什么人们

更新服务器后，我无法重新启动kubernetes。

Feb  6 10:34:26 chgvas99 kubelet: F0206 10:34:26.662744   27634 server.go:189] failed to load Kubelet config file /var/lib/kubelet/config.yaml, error failed to read kubelet config file "/var/lib/kubelet/config.yaml", error: open /var/lib/kubelet/config.yaml: no such file or directory
Feb  6 10:34:26 chgvas99 systemd: kubelet.service: main process exited, code=exited, status=255/n/a
Feb  6 10:34:26 chgvas99 systemd: Unit kubelet.service entered failed state.
Feb  6 10:34:26 chgvas99 systemd: kubelet.service failed.

我检查了目录，实际上没有 config.yaml 。我的节点上有相同的错误，我无法重新启动它们

服务器： 3.10.0-957.5.1.el7.x86_64

kubernetes：主要：“ 1”，次要：“ 13”，GitVersion：“ v1.13.3” GoVersion：“ go1.11.5”

Answer 1

我建议使用runninng'kubeadm-init'重新初始化集群。另外，请确保您的“ / var”目录不完整。有关“ kubeadm init”命令的更多信息，请参见link。

Answer 2

您正在使用kubeadm-/var/lib/kubelet/config.yaml为空这一事实很可能与工作节点未加入集群有关。

这可能与网络问题有关，但请逐步尝试：

1）为工作节点创建有效令牌以加入集群：
运行：sudo kubeadm token create --print-join-command --v=5，并确保您收到类似以下的输出命令：

kubeadm join <master-node-ip>:6443 --token aa334.. --discovery-token-ca-cert-hash sha256:..

2）在工作节点中运行提供的命令。

3）如果一切正常，请填充/var/lib/kubelet/config.yaml，并且sudo systemctl status kubelet的状态应该看起来不错。

4）如果出现错误-尝试使用--v=5运行ame join命令-您可能会看到一些网络问题。

4.A）如果遇到类似dial tcp <master-ip>:6443: connect: no route to host的错误-请确保您的节点之间有通信-从工作节点运行curl <master-node-ip>:6443-您可能会得到相同的{{1 }}错误。
转到主节点并打开no route（假设您正在使用安全的专用网络），然后再次尝试连接。

4.B）如果成功打开master中的端口，并且您能够从worker卷曲到master，则您应该收到来自API服务器的响应，例如：6443 port。

5）如果Client sent an HTTP request to an HTTPS server成功，但是您仍然遇到连接问题，请尝试：

5.A）比较主节点和工作节点的curl文件-确保API服务器的IP是正确的。

5.B）确保已在所有节点.kube/config上启用网桥联网模式。

5.C）确保您拥有calico，flannel或weave之类的SDN解决方案，并且您看到相关的kube系统pod正在运行：

sudo sysctl net.bridge.bridge-nf-call-iptables=1

6）如果没有任何效果，请尝试在工作节点上运行$kubectl -n kube-system get pods NAME READY STATUS RESTARTS AGE coredns-f9fd979d6-lpdlc 1/1 Running 2 7d12h coredns-f9fd979d6-vcs7g 1/1 Running 2 7d12h etcd-master-node-k8s 1/1 Running 2 7d12h kube-apiserver-master-node-k8s 1/1 Running 2 7d12h kube-controller-manager-master-node-k8s 1/1 Running 2 7d12h kube-proxy-kh2lc 1/1 Running 2 7d12h kube-proxy-lfmc4 1/1 Running 0 4m36s kube-scheduler-master-node-k8s 1/1 Running 2 7d12h weave-net-59r5b 2/2 Running 6 7d11h <-- Here weave-net-c44d6 2/2 Running 1 4m36s <-- Here。

Answer 3

My Env：初始化集群时的 3 个主负载均衡器和前端负载均衡器

不得不调整我的负载均衡器并取出其他主节点和“kubeadm init”，问题消失了，可能是网络错误。

然后读取所有其他主节点。

无法加载kubelet配置文件

3 个答案: