我正在尝试从网页中提取大量图片。
传统方法使用:
Elements media = doc.select(“[src]”);
是没用的,因为这个页面上有87个src标签,我只需要.jpg中的14个。
有没有办法只选择特定的文件类型进行提取?
由于
答案 0 :(得分:1)
是的,您可以使用attribute-ends-with selector [name$=value]
。
Elements pngs = document.select("img[src$=.png]");
// ...