使用JSoup从Wunderground中获取花粉类型

时间:2014-05-15 02:16:25

标签: html web-scraping jsoup

我目前正试图刮掉Wunderground的Pollen网站(因为他们的API目前还不支持花粉数据)。

doc = Jsoup.connect("http://www.wunderground.com/DisplayPollen.asp?Zipcode=19104").get();

for(int i = 0; i < 4; i++)
{
    Element levels = doc.select("td.levels").get(i);
    Element dates = doc.select("td.text-center.even-four").get(i);
    levelsList.add(levels.text());
    datesList.add(dates.text());
}

上面附有我用来捕获花粉指数和捕获日期的代码。

我目前正在尝试捕获花粉类型,下面是HTML的示例。

enter image description here

使用div.panel

Element pollenType = doc.select("div.panel").first();

刮掉了花粉类型,但它也刮擦了整个页面面板,这意味着它捕获的数据超出了我想要的数量。我只对此感兴趣:Pollen Type: Oak, Birch and Maple.

我必须抓住哪个分支?或者,我做错了什么?

1 个答案:

答案 0 :(得分:0)

如果您只对标题内容感兴趣,可以选择:

doc.select("div.panel h3").first().text()