帮助解决问题,有必要从维基百科中提取一些数据,我将在下图中显示:
在页面代码中,这些数据在此处:
如何获取此数据?这样做是通过使用jsoup。
我试着这样做:
System.out.println(doc.select("div.mw-body-content > p ").first().text());
但问题是,这不是代码中的第一个
,第二个是:
答案 0 :(得分:1)
通过其ID(应该是唯一的)获取父div
:
Elements parent = doc.select("div#mw-body-content");
获取此元素中的所有p
标记(包括您希望拥有的第二个标记):
Elements paragraphs = parent.getElementsByTag("p");
选择第二个:
String text = paragraphs.get(1).text();