当我从Java网页中检索数据时,为什么html实体显示错误:
URL url = new URL("http://www.eslcafe.com/joblist/index.cgi?read=27334");
URLConnection connection = url.openConnection();
BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("ISO-8859-1")));
String line = null;
while ((line = reader.readLine()) != null) {
System.out.println(line);
}
这个页面的标题应该被检索为“台湾新竹的一点点不同!”,但是“”从未正确显示,我的默认字符集也是“ISO-8859-1”
答案 0 :(得分:0)
我已经使用curl下载了您的网页,并使用十六进制编辑器打开它。它表明“在新竹中有点不同”之前的“”实际上是0xA0而不是0x20,即它不是人们通常使用的空白字符,也许这就是它没有正确显示的原因。希望它有所帮助。