我正在尝试提取网站上某些广告的链接,但我无法使其正常工作:( div看起来像这样:
我无法通过使用href类id来提取它,因为其他链接具有不同的类,这使我尝试通过使用h3类id来提取它,这对于每个添加项都是相同的,但我无法将其提取到工作,或者我肯定做错了事。
Elements pageSearch3 = page2.select(".lheight22.margintop5");
for(int l = 0; l < pageSearch3.size(); l++) {
String url = pageSearch3.get(l).attr("href");
System.out.println(url);
}
答案 0 :(得分:2)
看看选择器文档https://jsoup.org/cookbook/extracting-data/selector-syntax。
parent> child:直接从父级派生的子元素,例如 div.content> p查找p个元素;和身体> *找到直接 身体标签的孩子