Jsoup完整文本未被解析

时间:2016-08-03 07:08:22

标签: jsoup

我正在尝试解析包含大量数据的网站。当我打印解析的数据时,只打印几个字符。如何解析整个文本?我的计划如下:

String getText(String url){
    Document doc = null;
    try {
        doc = Jsoup.connect(url)
                .userAgent("Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36")
                .maxBodySize(0)
                .get();
    } catch (IOException e) {
        System.out.println("Error in extracting text");
    }

    System.out.print(doc.body().text());
    return (doc.body().text());

}

相同的代码在MAC上完美运行。我在1.9.2中使用Windows 10. My Jsoup版本。 Windows和MAC上的JVM都是1.8。在Windows和MAC上,IDE使用的是eclipse。网址的内容与此类似:

<html><head></head><body>
<h1>This is a test page</h1>
11111111 11111111 11111111 11111111 11111111
</body></html>

0 个答案:

没有答案