Zuul重试配置无法与Eureka

时间:2017-06-20 00:58:35

标签: spring-boot kubernetes netflix-eureka netflix-zuul

我有一个使用Spring Boot Zuul作为外部网关和Eureka作为服务发现的场景,所有这些都在Kubernetes中运行。

问题是,我想保证我的服务可用性,所以当我的服务实例发生故障时,我希望Zuul通过Eureka重试其他一个实例。

我尝试按照Ryan Baxter's post执行此操作。 另外,我尝试按照here提示。

问题在于,无论我做什么,看起来像Zuul都没有重试打电话。当我删除我的一个实例时,它会一直为我返回一个Timeout,直到Eureka地址获得同步。

我的application.yaml看起来像这样:

spring:
  cloud:
    loadbalancer:
      retry:
        enabled: true

 zuul:
  stripPrefix: true
  ignoredServices: '*'
  routes:
    my-service:
      path: /my-service/**
      serviceId: my-service-api
  retryable: true

 my-service:
  ribbon:
    maxAutoRetries: 3
    MaxAutoRetriesNextServer: 3
    OkToRetryOnAllOperations: true
    ReadTimeout: 5000
    ConnectTimeout: 3000

我的服务是使用Camden SR7(我也试过SR6):

"org.springframework.cloud:spring-cloud-dependencies:Camden.SR7"

还有Spring-retry:

org.springframework.retry:spring-retry:1.1.5.RELEASE

我的应用程序类看起来像这样:

@SpringBootApplication
@EnableEurekaClient
@EnableZuulProxy
@EnableRetry
public class MyZuulApplication

编辑:

通过邮递员,它带来了

{
    "timestamp": 1497959364819,
    "status": 500,
    "error": "Internal Server Error",
    "exception": "com.netflix.zuul.exception.ZuulException",
    "message": "TIMEOUT"
}.

看一下Zuul日志,它打印了{"level":"WARN","logger_name":"org.springframework.cloud.netflix.zuul.filters.post.SendErrorFilter","appName":...,"message":"Error during filtering","stack_trace":"com.netflix.zuul.exception.ZuulException: Forwarding error [... Stack Trace ...] Caused by: com.netflix.hystrix.exception.HystrixRuntimeException: my-service-api timed-out and no fallback available [... Stack Trace ...] Caused by: java.util.concurrent.TimeoutException: null

我发现了另一个有趣的日志:

{"level":"INFO" [...] current list of Servers=[ip_address1:port, ip_address2:port, ip_address3:port],Load balancer stats=Zone stats: {defaultzone=[Zone:[ ... ];    Instance count:3;   Active connections count: 0;    Circuit breaker tripped count: 0;   Active connections per server: 0.0;]
},Server stats: [[Server:ip_address1:port;  [ ... ] Total Requests:0;   Successive connection failure:0;    Total blackout seconds:0;   [ ... ]
, [Server:ip_address2:port; [ ... ] Total Requests:0;   Successive connection failure:0;    Total blackout seconds:0;   [ ... ]
, [Server:ip_address3:port; [ ... ] Total Requests:0;   Successive connection failure:0;    Total blackout seconds:0;   [ ... ]

1 个答案:

答案 0 :(得分:0)

问题似乎是由Hystrix超时引起的。 HystrixCommand的默认超时为1000毫秒,并且功能区不足以重试http请求。 尝试增加hystrix的超时,如下所示。

hystrix:
  command:
    default:
      execution:
        isolation:
          thread:
            timeoutInMilliseconds: 20000

它会将整个hystrix命令的超时时间增加到20秒。如果有效,请为您的环境调整以上值。您正在使用相当大的超时值进行读取和连接超时。因此,如果需要,您需要使用hystrix超时调整这些值。