我们正在使用Istio 1.1.4运行生产工作负载,并注意到在特定时间范围内,报告给遥测组件的客户端调用流量的请求延迟从50-60ms增加到6-7秒,同时我们开始了查看Envoy的500个(内部服务器错误)响应代码。
我们试图了解Envoy在什么情况下会返回500,而我在文档/源代码中唯一能发现的是,如果必须对响应主体进行缓冲并且超出了缓冲限制,则会返回500。对于我们而言,肯定不是这种情况,因为那500个事件发生在健康检查端点之外,其响应主体很小。
特使将返回500的情况是什么?我们应该调查什么作为问题的根本原因?
答案 0 :(得分:0)
能否请您提供以下状态代码?
a)日志输入 b)遥测 c)普罗米修斯和格拉法纳
,看看上面的三个是否都将响应代码显示为500或任何偏差?