JSoup爬行如何从相同标签但有两个项目进行爬行

时间:2019-02-08 19:51:33

标签: java jsoup

For explaining

我需要抓取span标签中的所有三个项目。我有一些代码,但我需要一些提示。到目前为止,这是我的代码。

News n = new News();
n.setHeadline(news.getElementsByTag("h2").first().text());
n.setTypeOfSport(news.getElementsByTag("span").first().text());

n.setDate(news.getElementsByTag("span").);

n.setTime(news.getElementsByTag("span").);

1 个答案:

答案 0 :(得分:2)

您似乎想从span中选取所有<div class="info">个元素,然后根据它们的位置(索引)进行访问。

假设您的news变量的类型为DocumentElement,则您应该有权使用select(CSSquerry)方法。如果它在某种程度上也保持了此<div class="info">,则您的代码如下所示:

Elements spans = news.select("div.info span");

//now you can get and handle text from all spans via
spans.get(0).text();
spans.get(1).text();
spans.get(2).text();

有关使用CSS选择元素的更多信息,请参见https://jsoup.org/cookbook/extracting-data/selector-syntax