Apache HttpComponents。获取CONNECT请求的响应

时间:2016-05-26 12:29:33

标签: java apache-httpclient-4.x apache-httpcomponents

我正在使用Apache HtppComponents(版本 - 4.5.2),并且我试图通过代理服务器请求HTTPS页面。

编辑:

我的主要问题是我需要知道如何区分代理服务器的故障和请求的URI的失败(对于HTTP和HTTPS)。我有很多代理,它们不可靠100%,所以在代理失败的情况下,我需要用不同的代理服务器重试请求。

例如(在HTTPS的情况下),在两种情况下都可以返回NoHttpResponseException,即代理失败或目标URL失败时。我怎么知道问题的根源? NoHttpResponseException从何而来?来自目标URI的代理?

我以为我可以尝试读取代理服务器CONNECT请求的响应,如果它是200,那么我意味着代理是好的,而下一个NoHttpResponseException来自目标网址。但是,如果我立即得到NoHttpResponseException(在代理返回我的CONNECT状态代码之前),这意味着代理本身存在问题,我需要使用不同的代理服务器重试请求。但我无法找到任何文档如何访问代理服务器返回的CONNECT请求的响应。

此外,有时我会收到HttpHostConnectExceptionConnectTimeoutException。我将此异常视为代理问题(对于HTTP和HTTPS) - 这是正确的方法吗?或者即使对于目标URL,也会发生这2个异常?

1 个答案:

答案 0 :(得分:2)

它不会很漂亮,但它应该做的伎俩

HttpHost myproxy = new HttpHost("myproxy", 8080)
CloseableHttpClient client = HttpClientBuilder.create()
        .setProxy(myproxy)
        .setProxyAuthenticationStrategy(new ProxyAuthenticationStrategy() {

            @Override
            public boolean isAuthenticationRequested(HttpHost authhost, HttpResponse response, HttpContext context) {

                if (myproxy.equals(authhost)) {
                    context.setAttribute("proxy.status", response.getStatusLine());
                }
                return super.isAuthenticationRequested(authhost, response, context);
            }
        })
        .build();

HttpClientContext context = HttpClientContext.create();
HttpGet get = new HttpGet("https://httpbin.org/");
try (CloseableHttpResponse response = client.execute(get, context)) {
    EntityUtils.consume(response.getEntity());
}
StatusLine proxyStatus = context.getAttribute("proxy.status", StatusLine.class);
System.out.println("Proxy said " + proxyStatus);

PS:HttpHostConnectExceptionConnectTimeoutException例外只能在第一跳上抛出,也就是说,在连接到代理时。如果代理因任何原因无法连接到目标服务器,它可能会响应CONNECT方法以5xx状态响应。