Kubernetes随机拒绝服务请求

时间:2018-02-08 14:02:56

标签: kubernetes

我最近开始在我的Kubernetes集群(v1.8.3-gke.0)上遇到很多连接失败的连接。 在负载下(每秒400多个请求),对具有足够资源的机器上传播的200个pod支持的服务的请求具有1%到10%的故障率,这显然是有问题的。 HTTP请求不会因4xx或5xx错误状态而失败,只是在某些时候被丢弃或拒绝。

请注意,pod的容量远远不够,其CPU使用率很少超过200毫秒。

即使没有负载过重,我也会监控很多请求在上一个服务之外的其他服务上随机失败,所以我怀疑集群级别的问题(docker?kubernetes?kernel?)。

我做了一些卷曲基准来衡量失败率。 当HTTP请求在循环上执行CURL请求失败时,显示的错误为curl: (7) Failed to connect to 10.x.x.x port 80: Connection refused

我们的生产代码Cannot connect to host svc:80 ssl:False [Connect call failed ('10.x.x.x', 80)]报告时会收到类似的错误消息,但大多数请求都会成功。

您是否知道出现了什么问题,或者如何跟踪此问题?

0 个答案:

没有答案