使用Jsoup文档设置字符编码

时间:2015-10-08 10:39:36

标签: character-encoding jsoup

我正在尝试使用Jsoup文档设置不同的字符编码,但它没有按预期工作。所有类型的编码的输出都相同。有人可以帮忙吗?

Document doc = Jsoup.parse("&micro, Î, €, Ô, ù, ê, ü, Č, č, Ř, ř, Š, ș, Ž, ž, Ď, ď, Ť, ť, Ň, ň, Ů, ů, Ě, ě");

doc.outputSettings().charset("ISO-8859-1");
System.out.println(doc.text());

doc.outputSettings().charset("Latin1");
System.out.println(doc.text());

doc.outputSettings().charset("CP1252");
System.out.println(doc.text());

doc.outputSettings().charset("UTF-8");
System.out.println(doc.text());

在所有情况下输出都相同:

μ,Î,€,Ô,ù,ê,ü,Č,č,Ř,ř,Š,ş,Ž,ž,Ď,ď,Ť,ť,Ň,ň,Ů,......,Ě ,ě

0 个答案:

没有答案