当给出pdf文件(并且很可能是其他文件)时,JSoup下载整个文件,在查看内容类型之前发现它无法解析它。
有没有办法阻止下载pdf文件本身,所以只要它读取了http标题就会抛出“Unhandled content type”异常?
我目前的代码如下:
connection = Jsoup.connect(uri.toString());
Document doc=connection.get();
我能想到的唯一解决方案是自己读取标题,然后使用parseBodyFragment,但这似乎很多工作,如果我还需要计算正确的字符集。
答案 0 :(得分:1)
是的,下载1.6.4-Pending解决了这个问题。