嗨,我正在管理一个由Kops创建的Kubernetes集群。我最近将Kubernetes更新为1.9.9
,并对集群执行了滚动更新。除了出现了一个新的烦人的问题,一切似乎都进行得很好:
我的Kubernetes api服务器以非常偶然的意外方式无法使用。有时它会在几分钟,有时半小时内变得无法访问。然后,如果再次尝试,它会奇迹般地再次起作用。这使我很难使用Kubernetes集群。有谁知道为什么这些错误消息不断弹出?
Unable to connect to the server: net/http: TLS handshake timeout
和
The connection to the server api.xxx.io was refused - did you specify the right host or port?
答案 0 :(得分:0)
当@justinsb向我指出正确的方向时,我在kubernets/kops github存储库上发布了相同的问题。他建议ssh进入主节点并执行docker ps
来查看所有容器是否稳定。
我发现这样做是因为我的apiserver容器一直崩溃。这就是导致我得出的结论,即我的主节点可能没有足够的计算能力来处理所有请求。我将主ec2实例从t2.micro
更改为t2.medium
,问题消失了。