Apache html响应返回乱码

时间:2015-06-12 15:22:44

标签: java html apache-httpcomponents

我正在尝试从远程网站获取HTML响应,我得到类似的结果:

ס×?×? ×?×? ×?×? ×?×?

而不是希伯来字母或符号。

这是我的代码:

CloseableHttpClient httpclient = HttpClients.custom()
                    .setDefaultCookieStore(cookieStore)
                    .build();

            HttpGet httpget = new HttpGet(URL);
            CloseableHttpResponse response = httpclient.execute(httpget);
            HttpEntity entity = response.getEntity();
            String s=null;
            if (entity != null) {
                 s= EntityUtils.toString(entity);          
            }   

有谁知道问题是什么?

1 个答案:

答案 0 :(得分:1)

根据文档,

  

使用实体中的字符集(如果有)转换内容,如果没有,则使用“ISO-8859-1”。

正在使用默认字符集,因为您没有提供默认字符集,而且没有正确映射这些字符 - 您应该使用UTF-8代替。试试这个。

s= EntityUtils.toString(entity, "UTF-8");