尝试解析链接时,我在日志文件中看到以下异常。
java.nio.charset.UnsupportedCharsetException: uft-8
at java.nio.charset.Charset.forName(Charset.java:524)
at org.jsoup.helper.DataUtil.parseByteData(DataUtil.java:87)
at org.jsoup.helper.HttpConnection$Response.parse(HttpConnection.java:481) org.jsoup.helper.HttpConnection.get(HttpConnection.java:149)
不确定为什么utf-8不受支持。
答案 0 :(得分:0)
jsoup当然支持UTF-8。但是你要点击的网址是“uft-8”。我不知道那是什么,你的JVM也不知道,它定义了哪些字符集是受支持的。谁配置了这个URL已经打字错误。
如果这是您知道并需要重新访问的URL,则可以使用jsoup.connection.execute,并在运行parse()之前将响应编码标头固定为“UTF-8”,并将编码设置为UTF -8明确。