我试图让div class news column index
里面的所有链接都是html的结构:
在这里我尝试了但实际上并没有给我任何结果,我真的不知道为什么:///
Document doc = Jsoup.connect("http://www.gsmarena.com/").get();
Elements els = doc.select("#body > div > div.news-column-index > ul");
for(Element e : els)
{
System.out.println(e.attr("href"));
}
编辑:这是我正在解析的网址:http://www.gsmarena.com/
答案 0 :(得分:1)
这对我来说很好用:
String str="http://www.gsmarena.com/"; Document doc=Jsoup.connect(str).userAgent(" Mozilla//5.0 (Windows NT 6.1; WOW64) AppleWebKit//537.36 (KHTML, like Gecko) Chrome//49.0.2623.110 Safari//537.36").get();
Elements links = doc.select("li[class=news-column-list-item]");
for (Element link : links) {
System.out.println(link.select("a[href]").attr("href"));
}
答案 1 :(得分:0)
#body > div > div.news-column-index > ul > li >a
也许你可以尝试这个选择器 ul没有href属性