如何废弃源页面中不可见的数据?

时间:2016-11-24 13:09:35

标签: web-crawler jsoup

基本上我想抓取特定标签的codechef问题,但在此 link此页面的所有内容都是动态的,所以现在我很无奈,请帮帮我

2 个答案:

答案 0 :(得分:0)

我们在StormCrawler中使用jBrowserDriver,这应该允许您以编程方式导航网站并提取您需要的内容

答案 1 :(得分:0)

尝试使用selenium,它将允许您实时加载页面,从那里获取页面源,然后将页面源(html)传递到jsoup。