使用Spring WebClient的内存泄漏

时间:2018-07-31 18:18:23

标签: out-of-memory rx-java reactive-programming rx-java2 spring-webflux

我想浏览域名列表(数百万条记录),发送请求并接收响应,以便确定它是否存在。

我选择了一种反应性方法,我希望它仅用几个线程即可为大量主机提供服务,但是我注意到堆内存一直在增长,直到达到OutOfMemory。

这是我的代码:

@Slf4j
@Component
@RequiredArgsConstructor

public static class DataLoader implements CommandLineRunner {

    private final ReactiveDomainNameRepository reactiveDomainNameRepository;

    @Override
    @SneakyThrows
    public void run(String... strings) {
        ReactorClientHttpConnector connector = getConnector(); // Trying to reuse connector instead of creating new each time

        reactiveDomainNameRepository.findAllByResourcesIsNull() // Flux<DomainEntity>. This basically streams data from MongoDB using reactive driver
                .publishOn(Schedulers.parallel())
                .flatMap(domain -> performRequest(connector, domain)) // If I remove this line everything starts working just fine
                .buffer(1000) // Little optimization. The problem with memory remains even if I don't use buffering.
                .flatMap(reactiveDomainNameRepository::saveAll)
                .subscribe();
    }

    private Mono<DomainEntity> performRequest(ReactorClientHttpConnector connector, DomainEntity domain) {
        return WebClient
                .builder()
                .clientConnector(connector)
                .baseUrl("http://" + domain.getHost())
                .build()
                .get()
                .exchange()
                .onErrorResume(error -> {
                    log.error("Error while requesting '{}': ", domain.getHost());

                    return Mono.empty();
                }) // Mono<ClientResponse>
                .flatMap(resp -> {

                    if (resp.statusCode() == OK) {
                        log.info("Host '{}' is ok", domain.getHost());
                    } else {
                        log.info("Host '{}' returned '{}' status code", domain.getHost(), resp.statusCode().value());
                    }

                    // Consuming response as described in Spring documentation. Tried also resp.toEntity(String.class) but got the same result
                    return resp.toEntity(Void.class)
                            .map(nothing -> domain);
                });
    }
}

这是堆内存使用情况。不要在5:59-6:05期间注意-那是应用程序停止处理数据的地方,因为我没有处理极端情况。通常,它会一直增长直到达到内存限制。 enter image description here

所以我基本上有两个问题:

  1. 我的代码怎么了?
  2. 使用响应式方法向不同的主机发出大量请求是一个好主意吗?

1 个答案:

答案 0 :(得分:2)

只需使用retrieve()而不是exchange(),您甚至不需要混乱的错误处理。

我知道这是一个较晚的答复,但是前段时间我遇到了完全相同的问题,碰到了您的问题,只是我想将这种可能的解决方案留在这里。 :)

并回答您的问题:

  1. 使用exchange()时,您负责处理连接和错误处理,因此不建议这样做,只有在确实需要控制时才应使用。

  2. 好吧,您正在使用并行构建,所以为什么不这样做。