我在Azure云上有以下3个Ubuntu计算机集群:
172.16.0.7 (master)
172.16.0.4 (kube-01)
172.16.0.5 (kube-02)
在172.16.0.4 (kube-01)
我有一个名为发布商的广告连播,其端口 8080 已曝光。为了让它可供世界使用,我定义了以下服务:
"id": "publisher-service",
"kind": "Service",
"apiVersion": "v1beta1",
"port": 8181,
"containerPort": 8080,
"publicIPs": ["172.16.0.4", "172.16.0.5"],
"selector": {
"group": "abc",
"component": "publisher"
},
"labels": {
"group": "abc"
}
172.16.0.4
和172.16.0.5
分别是kube-01
和kube-02
的内部IP地址(Azure术语)
在172.16.0.4 (kube-01)
我已定义Azure端点,公共端口设置为 8181 ,私有端口设置为 8181
在172.16.0.5 (kube-02)
我已定义Azure端点,公共端口设置为 8182 ,私有端口设置为 8181
通过这样的设置,我可以使用我的VM公共虚拟IP(VIP)地址和端口 8181 成功访问publisher-service
。
但是我希望能够使用相同的VIP地址和端口 8182 (因为它映射到端口 8181 )到达publisher-service
kube-02
)。相反,curl
报告Recv failure: Connection reset by peer
。
我在这里做错了吗?也许我对Kubernetes External Services的理解不正确(因此我的期望是错误的)?
我还注意到在/var/log/upstart/kube-proxy
中记录了以下条目:
E0404 17:36:33.371889 1661 proxier.go:82] Dial failed: dial tcp 10.0.86.26:8080: i/o timeout
E0404 17:36:33.371951 1661 proxier.go:110] Failed to connect to balancer: failed to connect to an endpoint.
以下是iptables -L -t nat
上捕获的172.16.0.5 (kube-02)
输出的一部分:
Chain KUBE-PORTALS-CONTAINER (1 references)
target prot opt source destination
REDIRECT tcp -- anywhere 11.1.1.2 /* kubernetes */ tcp dpt:https redir ports 45717
REDIRECT tcp -- anywhere 11.1.1.1 /* kubernetes-ro */ tcp dpt:http redir ports 34122
REDIRECT tcp -- anywhere 11.1.1.221 /* publisher-service */ tcp dpt:8181 redir ports 48046
REDIRECT tcp -- anywhere 172.16.0.4 /* publisher-service */ tcp dpt:8181 redir ports 48046
REDIRECT tcp -- anywhere 172.16.0.5 /* publisher-service */ tcp dpt:8181 redir ports 48046
Chain KUBE-PORTALS-HOST (1 references)
target prot opt source destination
DNAT tcp -- anywhere 11.1.1.2 /* kubernetes */ tcp dpt:https to:172.16.0.5:45717
DNAT tcp -- anywhere 11.1.1.1 /* kubernetes-ro */ tcp dpt:http to:172.16.0.5:34122
DNAT tcp -- anywhere 11.1.1.221 /* publisher-service */ tcp dpt:8181 to:172.16.0.5:48046
DNAT tcp -- anywhere 172.16.0.4 /* publisher-service */ tcp dpt:8181 to:172.16.0.5:48046
DNAT tcp -- anywhere 172.16.0.5 /* publisher-service */ tcp dpt:8181 to:172.16.0.5:48046
我正在使用Kubernetes v0.12.0。我跟着this guide来设置我的集群(即我正在使用法兰绒)。
更新#1 :添加了publisher
广告连播状态信息。
apiVersion: v1beta1
creationTimestamp: 2015-04-04T13:24:47Z
currentState:
Condition:
- kind: Ready
status: Full
host: 172.16.0.4
hostIP: 172.16.0.4
info:
publisher:
containerID: docker://6eabf71d507ad0086b37940931aa739534ef681906994a6aae6d97b8b213
image: xxxxx.cloudapp.net/publisher:0.0.2
imageID: docker://5a76329ae2d0dce05fae6f7b1216e346cef2e5aa49899cd829a5dc1f6e70
ready: true
restartCount: 5
state:
running:
startedAt: 2015-04-04T13:26:24Z
manifest:
containers: null
id: ""
restartPolicy: {}
version: ""
volumes: null
podIP: 10.0.86.26
status: Running
desiredState:
manifest:
containers:
- capabilities: {}
command:
- sh
- -c
- java -jar publisher.jar -b $KAFKA_SERVICE_HOST:$KAFKA_SERVICE_PORT
image: xxxxx.cloudapp.net/publisher:0.0.2
imagePullPolicy: PullIfNotPresent
name: publisher
ports:
- containerPort: 8080
hostPort: 8080
protocol: TCP
resources: {}
terminationMessagePath: /dev/termination-log
dnsPolicy: ClusterFirst
id: ""
restartPolicy:
always: {}
version: v1beta2
volumes: null
generateName: rc-publisher-
id: rc-publisher-ls6k1
kind: Pod
labels:
group: abc
namespace: default
resourceVersion: 22853
selfLink: /api/v1beta1/pods/rc-publisher-ls6k1?namespace=default
uid: f746555d-dacd-11e4-8ae7-000d3a101fda
答案 0 :(得分:0)
外部网络实际上似乎工作正常 - 您在日志中看到的消息是因为kube-proxy确实收到了您发送给它的请求。
它失败的原因是,kube-proxy无法与你的pod对话。法兰绒无法正确布线到您的吊舱的IP,或者吊舱不健康。由于向172.16.0.4发送请求有效,因此您的法兰绒设置可能出现问题。您可以通过尝试从节点2卷曲10.0.86.26:8080来确认这一点。
如果pod的运行状况可能有问题,您可以通过运行kubectl.sh get pod $POD_NAME --output=yaml
来检查其详细状态。
抱歉有困难!
答案 1 :(得分:0)
使用k8s v0.14.2 重新安装群集后,一切都按预期开始工作。我跟随Brendan Burns Docker Guide。