Jsoup(查找元素)

时间:2014-06-01 09:39:42

标签: java jsoup

帮助解决问题,有必要从维基百科中提取一些数据,我将在下图中显示:

data from wiki

在页面代码中,这些数据在此处:

code wiki

如何获取此数据?这样做是通过使用jsoup。

我试着这样做:

 System.out.println(doc.select("div.mw-body-content > p ").first().text());

但问题是,这不是代码中的第一个

,第二个是:

desired data

1 个答案:

答案 0 :(得分:1)

  1. 通过其ID(应该是唯一的)获取父div

    Elements parent = doc.select("div#mw-body-content");
    
  2. 获取此元素中的所有p标记(包括您希望拥有的第二个标记):

    Elements paragraphs = parent.getElementsByTag("p");
    
  3. 选择第二个:

    String text = paragraphs.get(1).text();