当我从Java网页中检索数据时,为什么html实体显示错误

时间:2012-12-30 07:12:47

标签: java html-entities

当我从Java网页中检索数据时,为什么html实体显示错误:

    URL url = new URL("http://www.eslcafe.com/joblist/index.cgi?read=27334");
    URLConnection connection = url.openConnection();

    BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("ISO-8859-1")));

    String line = null;

    while ((line = reader.readLine()) != null) {

        System.out.println(line);
    }

这个页面的标题应该被检索为“台湾新竹的一点点不同!”,但是“”从未正确显示,我的默认字符集也是“ISO-8859-1”

1 个答案:

答案 0 :(得分:0)

我已经使用curl下载了您的网页,并使用十六进制编辑器打开它。它表明“在新竹中有点不同”之前的“”实际上是0xA0而不是0x20,即它不是人们通常使用的空白字符,也许这就是它没有正确显示的原因。希望它有所帮助。