Java链接提取Jsoup

时间:2016-05-12 09:57:54

标签: java html css web

我正在解析一个网页:http://www.dn.se/nyhetsdygnet/,在每个新闻列表的底部都有一个按钮来加载更多新闻文章。当我按下它时,URL被更改为类似http://www.dn.se/nyhetsdygnet/#getMoreArticles/2016-05-09/80的内容,并且它会在列表中加载更多链接(文章),我的问题是我有下面的代码,即使我给它新的链接(与加载更多的链接)它不识别新加载的链接,它只打印按下加载更多按钮之前可用的链接,这是我的代码:

Document doc = Jsoup.connect("http://www.dn.se/nyhetsdygnet/#getMoreArticles/2016-05-09/120").timeout(100000).userAgent(" Mozilla//5.0 (Windows NT 6.1; WOW64) AppleWebKit//537.36 (KHTML, like Gecko) Chrome//49.0.2623.110 Safari//537.36").get();;
       Elements s = doc.select("#container-20160509 > ul > li a");


       for(Element e : s)
       {
           System.out.println(e);
       }

0 个答案:

没有答案