如何从迭代器获取url,我使用jsoup。
我尝试urls.add(ite.next().parentNode().attributes().asList().get(0).toString());
,但价值不是需要的。
答案 0 :(得分:1)
我建议您阅读有关如何从元素中提取属性值的文档: http://jsoup.org/cookbook/extracting-data/attributes-text-html
堆栈溢出本身也有这个例子: getting attribute value from Div tag through jSoup
这样的事情可以解决你的问题:
Element link = doc.getElementById("yourlinkid");
String attr = link.attr("href");
System.out.println(attr);
使用不同的选择器可以通过不同的方式查找链接。
答案 1 :(得分:0)
拥有父节点后,您应该可以调用attr函数 请参阅文档:http://jsoup.org/apidocs/org/jsoup/nodes/Node.html#attr(java.lang.String)
还要注意选项以abs为前缀来获取绝对路径而不是相对路径:
String url = a.attr("abs:href");