Kubernetes服务不再相互可达

时间:2018-12-07 08:56:37

标签: networking kubernetes google-kubernetes-engine

我正在GKE上运行Kubernetes,但之前却可以,但是大约2天前发生了一些变化。我认为我没有对配置进行任何更改。我的服务似乎不再起作用。我的服务都无法互相通信。 SSH进入运行中的Pod时,我无法通过其服务名称ping通它们,也无法通过其内部IP地址ping通它们。负载平衡器的外部IP无法访问。这是我如何定义部署的示例:

apiVersion: apps/v1beta1
kind: Deployment
metadata:
  labels:
    ksonnet.io/component: app-name
  name: app-name
spec:
  replicas: 1
  template:
    metadata:
      labels:
        app: app-name

这里是服务:

apiVersion: v1
kind: Service
metadata:
  labels:
    ksonnet.io/component: app-name
  name: app-name
spec:
  loadBalancerIP: x.x.x.x
  ports:
  - port: 4999
    targetPort: 5000
  selector:
    app: app-name
  type: LoadBalancer

我对Kubernetes和网络还很陌生,我不知道在哪里查找或如何调试此问题。

编辑:

以下是相关的kubectl get services -n test

dashboard       ClusterIP      10.47.242.176   <none>        5000/TCP         1h
app-name        LoadBalancer   10.47.246.63    x.xxx.xx.xx   4999:31439/TCP   1h

然后是kubectl describe service app-name -n test

Name:                     app-name
Namespace:                test
Labels:                   app.kubernetes.io/deploy-manager=ksonnet
                          ksonnet.io/component=app-name
Annotations:              ksonnet.io/managed: {pristine...}
Selector:                 app=app-name
Type:                     LoadBalancer
IP:                       10.47.246.63
IP:                       xx.xxx.xx.x
LoadBalancer Ingress:     xx.xxx.xx.x
Port:                     <unset>  4999/TCP
TargetPort:               5000/TCP
NodePort:                 <unset>  31439/TCP
Endpoints:                10.44.1.141:5000
Session Affinity:         None
External Traffic Policy:  Cluster
Events:                   <none>

编辑2:我在默认端口上尝试了curl命令,但超时了:

curl: (7) Failed to connect to app-name port 80: Connection timed out

在完整端点上尝试时,连接被拒绝:

curl: (7) Failed to connect to app-name port 4999: Connection refused

在查看部署时,我得到以下pod模板:

Pod Template:
  Labels:  app=app-name
  Containers:
   model-manager:
    Image:      gcr.io/ns-delay/app-name:0.1
    Port:       5000/TCP
    Host Port:  0/TCP

1 个答案:

答案 0 :(得分:0)

我看到您的服务中的选择器与Deployment中的标签不匹配,请更改为

metadata: labels: app: app-name

在您的部署中,它应该可以正常工作。