我正在尝试解析包含大量数据的网站。当我打印解析的数据时,只打印几个字符。如何解析整个文本?我的计划如下:
String getText(String url){
Document doc = null;
try {
doc = Jsoup.connect(url)
.userAgent("Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36")
.maxBodySize(0)
.get();
} catch (IOException e) {
System.out.println("Error in extracting text");
}
System.out.print(doc.body().text());
return (doc.body().text());
}
相同的代码在MAC上完美运行。我在1.9.2中使用Windows 10. My Jsoup版本。 Windows和MAC上的JVM都是1.8。在Windows和MAC上,IDE使用的是eclipse。网址的内容与此类似:
<html><head></head><body>
<h1>This is a test page</h1>
11111111 11111111 11111111 11111111 11111111
</body></html>