我正在AWS负载平衡器后面运行Spring Cloud Gateway(据了解是基于Spring Webflux构建的),并且收到间歇性502错误。经调查,问题似乎与负载均衡器和我的节点之间的连接超时有关。根据调查,底层Netty服务器的默认超时时间为10秒。我使用以下命令确定了这一点...
time nc -vv 10.10.xx.xxx 5100
Connection to 10.10.xx.xxx 5100 port [tcp/*] succeeded!
real 0m10.009s
user 0m0.000s
sys 0m0.000s
虽然我可以将负载均衡器上的idleTimeout设置为10秒以内,但感觉效率很低。如果可能的话,我希望将其保持在30秒以上。相反,我想增加Netty服务器上的连接超时。我试图在我的application.yml中设置server.connection-timeout属性。
server:
connection-timeout: 75000
还通过指定秒数...
server:
connection-timeout: 75s
但是当我运行time命令以查看我的连接能持续多长时间时,它的超时没有变化,它仍然在10秒时结束...
time nc -vv 10.10.xx.xxx 5100
Connection to 10.10.xx.xxx 5100 port [tcp/*] succeeded!
real 0m10.009s
user 0m0.000s
sys 0m0.000s
我在这里想念什么?
答案 0 :(得分:1)
Netty服务器尚不支持server.connection-timeout
配置密钥,我提出了spring-boot#15368来解决该问题。
连接超时大约是我们应该等待建立连接的最长时间。如果您要自定义读取/写入超时,则可以使用其他选项。如果服务器在配置的持续时间内未从客户端接收数据,则可以添加ReadTimeoutHandler
来关闭连接。与WriteTimeoutHandler
相同,但是这次是服务器将数据写入客户端。
这是一个完整的示例:
@Configuration
public class ServerConfig {
@Bean
public WebServerFactoryCustomizer serverFactoryCustomizer() {
return new NettyTimeoutCustomizer();
}
class NettyTimeoutCustomizer implements WebServerFactoryCustomizer<NettyReactiveWebServerFactory> {
@Override
public void customize(NettyReactiveWebServerFactory factory) {
int connectionTimeout = //...;
int writetimeout = //...;
factory.addServerCustomizers(server -> server.tcpConfiguration(tcp ->
tcp.option(ChannelOption.CONNECT_TIMEOUT_MILLIS, connectionTimeout)
.doOnConnection(connection ->
connection.addHandlerLast(new WriteTimeoutHandler(writetimeout)))));
}
}
}
现在回到您的问题,我已经使用以下控制器测试了该配置:
@RestController
public class TestController {
@GetMapping(path = "/", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<String> textStream() {
return Flux.interval(Duration.ofSeconds(5)).map(String::valueOf);
}
}
只要间隔短于配置的写超时,服务器就不会关闭连接。您可以使用httpie和以下命令http localhost:8080/ --stream --timeout 60
进行验证。
我已经在本地计算机上测试了该netcat命令,并且到目前为止没有超时。
time nc -vv 192.168.0.28 8080
192.168.0.28 8080 (http-alt) open
^CExiting.
Total received bytes: 0
Total sent bytes: 0
nc -vv 192.168.0.28 8080 0.01s user 0.00s system 0% cpu 2:36.53 total
这可能是在操作系统级别配置的,还是网络设备已配置为关闭此类连接?我刚刚看到您添加了spring-cloud-gateway标签-也许这是该项目特有的东西?
答案 1 :(得分:0)
https://docs.spring.io/spring-boot/docs/current/reference/html/common-application-properties.html的Spring文档当前将server.connection-timeout
定义为“连接器在关闭连接之前等待另一个HTTP请求的时间。”
对于Netty,这不是该属性当前的功能。现在,该属性控制TCP连接握手超时,这完全不同。
有关此信息,例如如何在https://github.com/spring-projects/spring-boot/issues/18473上实际配置空闲/保持活动超时的示例
具体来说,您可以使用类似以下的内容:
import io.netty.channel.Channel;
import io.netty.channel.ChannelDuplexHandler;
import io.netty.channel.ChannelHandlerContext;
import io.netty.channel.ChannelInitializer;
import io.netty.handler.timeout.IdleStateEvent;
import io.netty.handler.timeout.IdleStateHandler;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.web.embedded.netty.NettyReactiveWebServerFactory;
import org.springframework.boot.web.reactive.server.ReactiveWebServerFactory;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import java.time.Duration;
import static java.util.concurrent.TimeUnit.NANOSECONDS;
@Configuration
public class NettyConfig {
@Bean
public ReactiveWebServerFactory reactiveWebServerFactory(@Value("${server.netty.idle-timeout}") Duration idleTimeout) {
final NettyReactiveWebServerFactory factory = new NettyReactiveWebServerFactory();
factory.addServerCustomizers(server ->
server.tcpConfiguration(tcp ->
tcp.bootstrap(bootstrap -> bootstrap.childHandler(new ChannelInitializer<Channel>() {
@Override
protected void initChannel(Channel channel) {
channel.pipeline().addLast(
new IdleStateHandler(0, 0, idleTimeout.toNanos(), NANOSECONDS),
new ChannelDuplexHandler() {
@Override
public void userEventTriggered(ChannelHandlerContext ctx, Object evt) {
if (evt instanceof IdleStateEvent) {
ctx.close();
}
}
}
);
}
}))));
return factory;
}
}