Jsoup bug? Jsoup.parse卡住了

时间:2012-08-24 11:30:51

标签: jsoup

我尝试解析以下网址:http://www.cisg.law.pace.edu/cisg/biblio/full-biblio.html

URL url = new URL("http://www.cisg.law.pace.edu/cisg/biblio/full-biblio.html");
int timeout = 20 * 1000;
System.out.println("Start parsing...");
Jsoup.parse(url, timeout);
System.out.println("Done");

我运行它并且从未收到“完成”消息。 奇怪的是,这个HTML只有3MB,所以我看不出它需要这么长时间的原因。

1 个答案:

答案 0 :(得分:1)

好像是一个错误。我已经尝试了使用jsoup 1.6.3版本所说的内容,并且执行被卡在Document doc = DataUtil.parseByteData(byteData, charset, url.toExternalForm(), req.parser());的{​​{1}}。

您可以使用以下代码验证是否正在建立连接:

org.jsoup.helper.HttpConnection