我最近将我的GKE集群从1.10.x升级到1.11.x,此后,由于livenessProbe错误,我的calico-node
吊舱无法连接到etcd集群,并以CrashLoopBackOff
结尾。 / p>
我看到calico-etcd
DaemonSet的状态为0,对此感到疑惑。 nodeSelector位于node-role.kubernetes.io/master=
。
从此类calico-node
的日志中:
2018-12-19 19:18:28.989 [INFO][7] etcd.go 373: Unhandled error: client: etcd cluster is unavailable or misconfigured; error #0: client: endpoint http://10.96.232.136:6666 exceeded header timeout
2018-12-19 19:18:28.989 [INFO][7] startup.go 254: Unable to query node configuration Name="gke-brokerme-ubuntu-pool-852d0318-j5ft" error=client: etcd cluster is unavailable or misconfigured; error #0: client: endpoint http://10.96.232.136:6666 exceeded header timeout
DaemonSet的状态:
NAME DESIRED CURRENT READY UP-TO-DATE AVAILABLE NODE SELECTOR AGE
calico-etcd 0 0 0 0 0 node-role.kubernetes.io/master= 3d
calico-node 2 2 0 2 0 <none> 3d
k get nodes --show-labels
:
NAME STATUS ROLES AGE VERSION LABELS
gke-brokerme-ubuntu-pool-852d0318-7v4m Ready <none> 4d v1.11.5-gke.5 beta.kubernetes.io/arch=amd64,beta.kubernetes.io/fluentd-ds-ready=true,beta.kubernetes.io/instance-type=n1-standard-2,beta.kubernetes.io/os=linux,cloud.google.com/gke-nodepool=ubuntu-pool,cloud.google.com/gke-os-distribution=ubuntu,failure-domain.beta.kubernetes.io/region=europe-west1,failure-domain.beta.kubernetes.io/zone=europe-west1-b,kubernetes.io/hostname=gke-brokerme-ubuntu-pool-852d0318-7v4m,os=ubuntu
gke-brokerme-ubuntu-pool-852d0318-j5ft Ready <none> 1h v1.11.5-gke.5 beta.kubernetes.io/arch=amd64,beta.kubernetes.io/fluentd-ds-ready=true,beta.kubernetes.io/instance-type=n1-standard-2,beta.kubernetes.io/os=linux,cloud.google.com/gke-nodepool=ubuntu-pool,cloud.google.com/gke-os-distribution=ubuntu,failure-domain.beta.kubernetes.io/region=europe-west1,failure-domain.beta.kubernetes.io/zone=europe-west1-b,kubernetes.io/hostname=gke-brokerme-ubuntu-pool-852d0318-j5ft,os=ubuntu
我没有修改任何印花布清单,它们应该由GKE 1:1设置。
我希望calico-node
连接到我的Kubernetes集群等,或者连接到DaemonSet设置的calico-etcd
。由于在GKE中没有可以控制的主节点,因此我有点明白calico-etcd
处于状态0的原因,但是calico-node
应该连接到哪个状态?我的小型基本设置有什么问题?
答案 0 :(得分:0)
我们知道GKE 1.11.x中的calico崩溃循环问题。您可以通过升级到较新的版本来解决此问题。 ,建议您升级到没有此问题的版本“ 1.11.4-gke.12”或“ 1.11.3-gke.23”。