我尝试解析以下网址:http://www.cisg.law.pace.edu/cisg/biblio/full-biblio.html
URL url = new URL("http://www.cisg.law.pace.edu/cisg/biblio/full-biblio.html");
int timeout = 20 * 1000;
System.out.println("Start parsing...");
Jsoup.parse(url, timeout);
System.out.println("Done");
我运行它并且从未收到“完成”消息。 奇怪的是,这个HTML只有3MB,所以我看不出它需要这么长时间的原因。
答案 0 :(得分:1)
好像是一个错误。我已经尝试了使用jsoup 1.6.3版本所说的内容,并且执行被卡在Document doc = DataUtil.parseByteData(byteData, charset, url.toExternalForm(), req.parser());
的{{1}}。
您可以使用以下代码验证是否正在建立连接:
org.jsoup.helper.HttpConnection