少于html表中的实际数据

时间:2015-12-10 16:30:59

标签: jsoup

我正在做

Element tbody = doc.select("td#tab table tbody").first();
System.out.println(tbody.childNodeSize());

在以下网址上。

http://164.100.181.140/fcs/Helpline/NFSA/ReportRegidWise.aspx?val=NSMxODcjUiMwMDEzNzMjMDM3OTg0IzEwMDEwMDMwMDAxMiNCUEwjMDkxODcwMDk0NjE4NDI5MQ%3d%3d

但只能回到 5 tr元素

后来我试着看看jsoup正在返回它只显示5个元素。

System.out.println(tbody.html());

Javascript

document.querySelector('td#tab table tbody').childNodes.length

显示623条记录。

Jsoup解析器有什么问题或者我犯了一些错误吗?

感谢。

1 个答案:

答案 0 :(得分:1)

该文档以大量编码数据开头。我认为Jsoup在1M之后截断了大小。如果您想获得整个文档,可以这样配置:

onCategoryChange

这需要更长的时间,但您可以获得所有信息。