GKE意外断开了eu-north

时间:2019-05-20 10:18:54

标签: kubernetes google-cloud-platform google-kubernetes-engine kubernetes-ingress gke-networking

这是我第一次接触k8s,我有些失望。

我在GKE网络中遇到问题。例如,我创建了一个Postgres Pod,有时(我将Node.JS与Typeorm一起使用,但这没关系),我收到有关丢失连接的错误日志。

那会每1-10分钟发生一次。

我使用PostgreSQL创建了一个简单的Compute Engine实例。从GKE内部的API使用该实例时,我没有任何问题。

Ingress也是如此。

我正在使用TCP负载平衡器(以及nginx-ingress)和1.13.5-gke.10版本。

我已经尝试过什么:

  • 我在不同区域创建了集群:Europe-north-a,europe-north-c。我不确定其他地区。
  • 我尝试了Postgres的聚集/非聚集图表。这不仅发生在Postgres,还发生在所有通讯中。
  • 我检查了kube-system的Pod,它们没有任何错误,并且运行时没有任何重新启动。我没有发现网络问题的任何具体原因。

以下是我收到的日志(用于nginx):

2019/05/20 10:02:51 [error] 612#612: *15687 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 10.0.0.23, server: domain.io, request: "POST / HTTP/2.0", upstream: "http://10.0.0.19:4000/", host: "domain.io:443"

我该怎么办?我有点绝望。

更新:我不确定,但是一旦将部署扩展到1个副本,它就会停止出现问题。我会继续调查,看看是否可行。

0 个答案:

没有答案