我有一个使用Spring Boot Zuul作为外部网关和Eureka作为服务发现的场景,所有这些都在Kubernetes中运行。
问题是,我想保证我的服务可用性,所以当我的服务实例发生故障时,我希望Zuul通过Eureka重试其他一个实例。
我尝试按照Ryan Baxter's post执行此操作。 另外,我尝试按照here提示。
问题在于,无论我做什么,看起来像Zuul都没有重试打电话。当我删除我的一个实例时,它会一直为我返回一个Timeout,直到Eureka地址获得同步。
我的application.yaml看起来像这样:
spring:
cloud:
loadbalancer:
retry:
enabled: true
zuul:
stripPrefix: true
ignoredServices: '*'
routes:
my-service:
path: /my-service/**
serviceId: my-service-api
retryable: true
my-service:
ribbon:
maxAutoRetries: 3
MaxAutoRetriesNextServer: 3
OkToRetryOnAllOperations: true
ReadTimeout: 5000
ConnectTimeout: 3000
我的服务是使用Camden SR7(我也试过SR6):
"org.springframework.cloud:spring-cloud-dependencies:Camden.SR7"
还有Spring-retry:
org.springframework.retry:spring-retry:1.1.5.RELEASE
我的应用程序类看起来像这样:
@SpringBootApplication
@EnableEurekaClient
@EnableZuulProxy
@EnableRetry
public class MyZuulApplication
编辑:
通过邮递员,它带来了
{
"timestamp": 1497959364819,
"status": 500,
"error": "Internal Server Error",
"exception": "com.netflix.zuul.exception.ZuulException",
"message": "TIMEOUT"
}.
看一下Zuul日志,它打印了{"level":"WARN","logger_name":"org.springframework.cloud.netflix.zuul.filters.post.SendErrorFilter","appName":...,"message":"Error during filtering","stack_trace":"com.netflix.zuul.exception.ZuulException: Forwarding error [... Stack Trace ...] Caused by: com.netflix.hystrix.exception.HystrixRuntimeException: my-service-api timed-out and no fallback available [... Stack Trace ...] Caused by: java.util.concurrent.TimeoutException: null
我发现了另一个有趣的日志:
{"level":"INFO" [...] current list of Servers=[ip_address1:port, ip_address2:port, ip_address3:port],Load balancer stats=Zone stats: {defaultzone=[Zone:[ ... ]; Instance count:3; Active connections count: 0; Circuit breaker tripped count: 0; Active connections per server: 0.0;]
},Server stats: [[Server:ip_address1:port; [ ... ] Total Requests:0; Successive connection failure:0; Total blackout seconds:0; [ ... ]
, [Server:ip_address2:port; [ ... ] Total Requests:0; Successive connection failure:0; Total blackout seconds:0; [ ... ]
, [Server:ip_address3:port; [ ... ] Total Requests:0; Successive connection failure:0; Total blackout seconds:0; [ ... ]
答案 0 :(得分:0)
问题似乎是由Hystrix超时引起的。 HystrixCommand的默认超时为1000毫秒,并且功能区不足以重试http请求。 尝试增加hystrix的超时,如下所示。
hystrix:
command:
default:
execution:
isolation:
thread:
timeoutInMilliseconds: 20000
它会将整个hystrix命令的超时时间增加到20秒。如果有效,请为您的环境调整以上值。您正在使用相当大的超时值进行读取和连接超时。因此,如果需要,您需要使用hystrix超时调整这些值。