使用Jsoup仅提取一种文件类型

时间:2011-09-18 10:44:18

标签: java html-parsing jsoup

我正在尝试从网页中提取大量图片。

传统方法使用:

Elements media = doc.select(“[src]”);

是没用的,因为这个页面上有87个src标签,我只需要.jpg中的14个。

有没有办法只选择特定的文件类型进行提取?

由于

1 个答案:

答案 0 :(得分:1)

是的,您可以使用attribute-ends-with selector [name$=value]

Elements pngs = document.select("img[src$=.png]");
// ...

另见: