按属性和类搜索JSoup

时间:2016-09-17 21:16:11

标签: java android web-scraping jsoup

你可以这样做:

Elements links = doc.select("a[href]");

找到所有" a"具有href属性的元素。

你可以这样做:

doc.getElementsByClass("title")

获取所有带有名为" title"

的类的元素

但我怎么能两个都做? (即搜索" a"元素,其中" href"标记也包含类"标题")。

1 个答案:

答案 0 :(得分:2)

你可以简单地拥有

Elements links = doc.select("a[href].title");

这将选择具有<a>href属性的所有title。该课程通过了by prepending it with a dot

  

选择器组合

     
      
  • 任何组合,例如a[href].highlight
  •   

完整示例:

public static void main(String[] args) {
    Document doc = Jsoup.parse(""
            + "<div>"
            + "  <a href='link1' class='title another'>Link 1</a>"
            + "  <a href='link2' class='another'>Link 2</a>"
            + "  <a href='link3'>Link 3</a>"
            + "</div>");

    Elements links = doc.select("a[href].title");
    System.out.println(links); // prints "<a href="link1" class="title another">Link 1</a>"
}