我使用kops设置了kubernetes集群:
kops create cluster \
--zones ap-southeast-1a \
--dns-zone=${DNS_ZONE} \
--node-count 3 \
--vpc=${VPC_ID} \
--subnets=${SUBNET_ID} \
${NAME}
已配置EC2实例,我可以在控制台中看到它们。
DNS_ZONE是abc.in,是route53中的公共托管区域
api.sp-southeast-1.es.k8s.abc.in. A 54.123.123.123
api.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123
etcd-a.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123
etcd-events-a.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123
我已经完成了关于同一问题的堆栈溢出讨论。
我正在使用3个t2.micro实例作为主服务器 和3个t2.medium节点实例
主节点的入站规则为:
Custom TCP Rule TCP 4003 - 65535 sg-0559ecf7ab (nodes.sp-southeast-1.es.k8s.abc.in)
Custom TCP Rule TCP 2382 - 4000 sg-0559674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in)
All traffic All All sg-0ecc38031f44 (masters.sp-southeast-1.es.k8s.abc.in)
SSH TCP 22 0.0.0.0/0
Custom UDP Rule UDP 1 - 65535 sg-0557674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in)
Custom TCP Rule TCP 1 - 2379 sg-0557674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in)
Custom TCP Rule TCP 443 0.0.0.0/0
当我输入
kops validate cluster
> unexpected error during validation: error listing nodes:
Get https://api.sp-southeast-1.es.k8s.abc.in/api/v1/nodes:
dial tcp 54.123.123.123:443: i/o timeout
答案 0 :(得分:0)
我已经升级了生产kube集群,但遇到了同样的问题。我们使用AWS云。
问题是由于群集api的dns配置不正确(AWS Route 53)造成的,也许是kops的一个错误?
为解决此问题,我手动为kube api设置了正确的IP地址,然后该api可以访问了。
更新: 我发现问题是由于错误的kops升级造成的,负责网络服务的kubelet没有正确运行。集群使用1.10 kubernetes,但AWS ec2映像为1.9。强制群集为1.9.8版本,群集升级正确运行,并且kubelet网络服务正确更新dns。