我正在使用google compute来设置kubernetes群集。它没有任何问题,运行良好。但有时候;不经常,kubernetes服务发现失败。从结构上讲,我正在使用复制控制器和k8服务来分配负载。
我验证了群集中没有任何节点重新启动。有没有人对此有任何意见?还要避免这种罕见情况应该是最佳做法吗?
答案 0 :(得分:0)
当pod正在启动或终止并且流量被定向到容器时,可能会发生您的问题。您应该使用livelinessProbe来检查容器。您可以通过3种方式进行运行状况检查:HTTP GET,Socket打开和运行命令。 HTTP GET和运行命令需要返回成功状态。对于套接字,如果可以打开它们,则认为探测成功。
apiVersion: v1
kind: ReplicationController
metadata:
name: my-nginx
spec:
replicas: 2
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx
ports:
- containerPort: 80
livenessProbe:
httpGet:
# Path to probe; should be cheap, but representative of typical behavior
path: /index.html
port: 80
initialDelaySeconds: 30
timeoutSeconds: 1