kubernetes:错误列出节点

时间:2018-07-21 15:46:13

标签: kubernetes devops kubectl kops

我使用kops设置了kubernetes集群:

kops create cluster \
    --zones ap-southeast-1a \
    --dns-zone=${DNS_ZONE} \
    --node-count 3 \
    --vpc=${VPC_ID} \
    --subnets=${SUBNET_ID} \
    ${NAME}

已配置EC2实例,我可以在控制台中看到它们。

DNS_ZONE是abc.in,是route53中的公共托管区域

api.sp-southeast-1.es.k8s.abc.in. A 54.123.123.123
api.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123
etcd-a.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123
etcd-events-a.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123 

我已经完成了关于同一问题的堆栈溢出讨论。

我正在使用3个t2.micro实例作为主服务器 和3个t2.medium节点实例

主节点的入站规则为:

Custom TCP Rule TCP 4003 - 65535 sg-0559ecf7ab (nodes.sp-southeast-1.es.k8s.abc.in) 
Custom TCP Rule TCP 2382 - 4000 sg-0559674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in) 
All traffic All All sg-0ecc38031f44 (masters.sp-southeast-1.es.k8s.abc.in) 
SSH TCP 22 0.0.0.0/0 
Custom UDP Rule UDP 1 - 65535 sg-0557674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in) 
Custom TCP Rule TCP 1 - 2379 sg-0557674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in) 
Custom TCP Rule TCP 443 0.0.0.0/0

当我输入

kops validate cluster
> unexpected error during validation: error listing nodes: 
Get https://api.sp-southeast-1.es.k8s.abc.in/api/v1/nodes: 
dial tcp 54.123.123.123:443: i/o timeout

1 个答案:

答案 0 :(得分:0)

我已经升级了生产kube集群,但遇到了同样的问题。我们使用AWS云。

问题是由于群集api的dns配置不正确(AWS Route 53)造成的,也许是kops的一个错误?

为解决此问题,我手动为kube api设置了正确的IP地址,然后该api可以访问了。

更新: 我发现问题是由于错误的kops升级造成的,负责网络服务的kubelet没有正确运行。集群使用1.10 kubernetes,但AWS ec2映像为1.9。强制群集为1.9.8版本,群集升级正确运行,并且kubelet网络服务正确更新dns。