我需要使用java代码获取特定URL的源代码。我能够获得UTF-8编码网页的源代码,但无法获得ISO-8859-1编码字符集的代码。我的问题是,是否可以使用java程序获取iso-8859-1的网站源代码?请帮忙
答案 0 :(得分:0)
如果您使用以下方法阅读,则需要通过
明确指定字符集 URL url = new URL(URL_TO_READ);
BufferedReader in = new BufferedReader(
new InputStreamReader(url.openStream(),"ISO-8859-1" ));
如果你的要求包含很少的解析,我会建议你使用JSOUP,它会从服务器的响应中读取字符集,你也可以explicitly set the charset