Kubernetes:Azure云上的所有minions都无法提供外部服务

时间:2015-04-04 17:51:21

标签: azure load-balancing kubernetes

我在Azure云上有以下3个Ubuntu计算机集群:

172.16.0.7 (master)
172.16.0.4 (kube-01)
172.16.0.5 (kube-02)

172.16.0.4 (kube-01)我有一个名为发布商的广告连播,其端口 8080 已曝光。为了让它可供世界使用,我定义了以下服务:

"id": "publisher-service",
  "kind": "Service",
  "apiVersion": "v1beta1",
  "port": 8181,
  "containerPort": 8080,
  "publicIPs": ["172.16.0.4", "172.16.0.5"],
  "selector": {
    "group": "abc",
    "component": "publisher"
  },
  "labels": {
    "group": "abc"
  }
  • 172.16.0.4172.16.0.5分别是kube-01kube-02的内部IP地址(Azure术语)

  • 172.16.0.4 (kube-01)我已定义Azure端点,公共端口设置为 8181 ,私有端口设置为 8181

  • 172.16.0.5 (kube-02)我已定义Azure端点,公共端口设置为 8182 ,私有端口设置为 8181

通过这样的设置,我可以使用我的VM公共虚拟IP(VIP)地址和端口 8181 成功访问publisher-service

但是我希望能够使用相同的VIP地址和端口 8182 (因为它映射到端口 8181 )到达publisher-service kube-02)。相反,curl报告Recv failure: Connection reset by peer

我在这里做错了吗?也许我对Kubernetes External Services的理解不正确(因此我的期望是错误的)?

我还注意到在/var/log/upstart/kube-proxy中记录了以下条目:

E0404 17:36:33.371889    1661 proxier.go:82] Dial failed: dial tcp 10.0.86.26:8080: i/o timeout
E0404 17:36:33.371951    1661 proxier.go:110] Failed to connect to balancer: failed to connect to an endpoint.

以下是iptables -L -t nat上捕获的172.16.0.5 (kube-02)输出的一部分:

Chain KUBE-PORTALS-CONTAINER (1 references)
target     prot opt source               destination
REDIRECT   tcp  --  anywhere             11.1.1.2             /* kubernetes */ tcp dpt:https redir ports 45717
REDIRECT   tcp  --  anywhere             11.1.1.1             /* kubernetes-ro */ tcp dpt:http redir ports 34122
REDIRECT   tcp  --  anywhere             11.1.1.221           /* publisher-service */ tcp dpt:8181 redir ports 48046
REDIRECT   tcp  --  anywhere             172.16.0.4           /* publisher-service */ tcp dpt:8181 redir ports 48046
REDIRECT   tcp  --  anywhere             172.16.0.5           /* publisher-service */ tcp dpt:8181 redir ports 48046

Chain KUBE-PORTALS-HOST (1 references)
target     prot opt source               destination
DNAT       tcp  --  anywhere             11.1.1.2             /* kubernetes */ tcp dpt:https to:172.16.0.5:45717
DNAT       tcp  --  anywhere             11.1.1.1             /* kubernetes-ro */ tcp dpt:http to:172.16.0.5:34122
DNAT       tcp  --  anywhere             11.1.1.221           /* publisher-service */ tcp dpt:8181 to:172.16.0.5:48046
DNAT       tcp  --  anywhere             172.16.0.4           /* publisher-service */ tcp dpt:8181 to:172.16.0.5:48046
DNAT       tcp  --  anywhere             172.16.0.5           /* publisher-service */ tcp dpt:8181 to:172.16.0.5:48046

我正在使用Kubernetes v0.12.0。我跟着this guide来设置我的集群(即我正在使用法兰绒)。


更新#1 :添加了publisher广告连播状态信息。

apiVersion: v1beta1
creationTimestamp: 2015-04-04T13:24:47Z
currentState:
  Condition:
  - kind: Ready
    status: Full
  host: 172.16.0.4
  hostIP: 172.16.0.4
  info:
    publisher:
      containerID: docker://6eabf71d507ad0086b37940931aa739534ef681906994a6aae6d97b8b213
      image: xxxxx.cloudapp.net/publisher:0.0.2
      imageID: docker://5a76329ae2d0dce05fae6f7b1216e346cef2e5aa49899cd829a5dc1f6e70
      ready: true
      restartCount: 5
      state:
        running:
          startedAt: 2015-04-04T13:26:24Z
  manifest:
    containers: null
    id: ""
    restartPolicy: {}
    version: ""
    volumes: null
  podIP: 10.0.86.26
  status: Running
desiredState:
  manifest:
    containers:
    - capabilities: {}
      command:
      - sh
      - -c
      - java -jar publisher.jar -b $KAFKA_SERVICE_HOST:$KAFKA_SERVICE_PORT
      image: xxxxx.cloudapp.net/publisher:0.0.2
      imagePullPolicy: PullIfNotPresent
      name: publisher
      ports:
      - containerPort: 8080
        hostPort: 8080
        protocol: TCP
      resources: {}
      terminationMessagePath: /dev/termination-log
    dnsPolicy: ClusterFirst
    id: ""
    restartPolicy:
      always: {}
    version: v1beta2
    volumes: null
generateName: rc-publisher-
id: rc-publisher-ls6k1
kind: Pod
labels:
  group: abc
namespace: default
resourceVersion: 22853
selfLink: /api/v1beta1/pods/rc-publisher-ls6k1?namespace=default
uid: f746555d-dacd-11e4-8ae7-000d3a101fda

2 个答案:

答案 0 :(得分:0)

外部网络实际上似乎工作正常 - 您在日志中看到的消息是因为kube-proxy确实收到了您发送给它的请求。

它失败的原因是,kube-proxy无法与你的pod对话。法兰绒无法正确布线到您的吊舱的IP,或者吊舱不健康。由于向172.16.0.4发送请求有效,因此您的法兰绒设置可能出现问题。您可以通过尝试从节点2卷曲10.0.86.26:8080来确认这一点。

如果pod的运行状况可能有问题,您可以通过运行kubectl.sh get pod $POD_NAME --output=yaml来检查其详细状态。

抱歉有困难!

答案 1 :(得分:0)

使用k8s v0.14.2 重新安装群集后,一切都按预期开始工作。我跟随Brendan Burns Docker Guide