Question

我正在尝试解析包含大量数据的网站。当我打印解析的数据时，只打印几个字符。如何解析整个文本？我的计划如下：

String getText(String url){
    Document doc = null;
    try {
        doc = Jsoup.connect(url)
                .userAgent("Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36")
                .maxBodySize(0)
                .get();
    } catch (IOException e) {
        System.out.println("Error in extracting text");
    }

    System.out.print(doc.body().text());
    return (doc.body().text());

}

相同的代码在MAC上完美运行。我在1.9.2中使用Windows 10. My Jsoup版本。 Windows和MAC上的JVM都是1.8。在Windows和MAC上，IDE使用的是eclipse。网址的内容与此类似：

<html><head></head><body>
<h1>This is a test page</h1>
11111111 11111111 11111111 11111111 11111111
</body></html>

Jsoup完整文本未被解析

0 个答案: