我是这个论坛的新手,还是Kubernetes的新手。但是,我对GKE群集有问题-一个节点的状态经常切换到NotReady
。在过去的两个星期中,每天至少可能发生一次。最大的问题是,在我真正需要它工作的白天,它会发生(我的网站出现故障)。重新启动后,一切都会恢复正常,但通常需要20分钟,而且我没有时间(或将要)每天这样做。
当查看节点的日志时,可以看到以下模式:当节点将其状态更改为NotReady
时,这三个消息将始终出现:
2020-10-06T07:58:03.782923Z curl: (28) Operation timed out after 10001 milliseconds with 0 bytes received
2020-10-06T07:58:03.782923Z Kubelet is unhealthy!
2020-10-06T07:58:21Z Node gke-cluster-default-pool-d02df301-cyfr status is now: NodeNotReady
有人对我可以做什么进行修复或至少有问题解决的想法丝毫没有吗?
最诚挚的问候,埃里克
答案 0 :(得分:1)
节点NotReady
可能由于多种原因而发生,例如:
请参考this答案进行调试。
除上述内容外,还请检查kubectl get events --all-namespaces
在您提供ATM的日志很少的情况下,似乎正在执行kubelet尝试执行的某些操作,但因此无法设置NotReady
状态。
请收集更多日志并将其发布到问题,这将有助于找出kubelet无法执行的操作。如果碰巧是wordpress应用程序(托管在kubernetes上)问题,那么此link可能会帮助
答案 1 :(得分:1)
谢谢大家的建议。
我和一个朋友交流,他在Kubernetes领域有更多的知识。他建议我获得功能更强大的VM,因此我将内存从1.7 GB升级到3.5 GB。自升级以来,到目前为止,我还没有遇到感觉很好的Note NotReady 问题。
我认为,一种选择可能是限制群集服务的资源,以确保Kubelet始终拥有所需的资源。这样一来,便有可能回到价格便宜,功能不强的机器上。
/埃里克