在Scrapy中提取<div>标签的属性值

时间:2019-06-07 17:39:54

标签: python web-scraping scrapy

我正在抓取一个网站。 我遇到了需要提取div标签的属性值的情况。例如 我需要从网页中提取“ lmnop”

我尝试了几个CSS选择器,但它们返回一个空列表。 对于上述例如。我写了一个CSS选择器为:

//---------- add this: List<String> base64Images = new ArrayList<>(); //---------- List<PhotoItem> picturesList = new ArrayList<>(); Uri uri = data.getData(); bitmap = decodeUri(uri,400); //---------- add this: base64Images(bitmapToBase64(bitmap)); //---------- PhotoItem photoItem = new PhotoItem(); photoItem.setPhoto(bitmap); picturesList.add(photoItem);

对于这段HTML代码,预期输出如下所示

代码:response.css('div.blahblah::attr(abc)').extract()

预期输出: [“ somehashvalue”]

0 个答案:

没有答案