获取URL的源代码

时间:2012-06-25 11:56:12

标签: java utf-8 iso-8859-1

我需要使用java代码获取特定URL的源代码。我能够获得UTF-8编码网页的源代码,但无法获得ISO-8859-1编码字符集的代码。我的问题是,是否可以使用java程序获取iso-8859-1的网站源代码?请帮忙

1 个答案:

答案 0 :(得分:0)

如果您使用以下方法阅读,则需要通过

明确指定字符集
    URL url = new URL(URL_TO_READ);
    BufferedReader in = new BufferedReader(
    new InputStreamReader(url.openStream(),"ISO-8859-1" ));

如果你的要求包含很少的解析,我会建议你使用JSOUP,它会从服务器的响应中读取字符集,你也可以explicitly set the charset