我正在抓取一个网站。 我遇到了需要提取div标签的属性值的情况。例如 我需要从网页中提取“ lmnop”
我尝试了几个CSS选择器,但它们返回一个空列表。 对于上述例如。我写了一个CSS选择器为:
//---------- add this:
List<String> base64Images = new ArrayList<>();
//----------
List<PhotoItem> picturesList = new ArrayList<>();
Uri uri = data.getData();
bitmap = decodeUri(uri,400);
//---------- add this:
base64Images(bitmapToBase64(bitmap));
//----------
PhotoItem photoItem = new PhotoItem();
photoItem.setPhoto(bitmap);
picturesList.add(photoItem);
对于这段HTML代码,预期输出如下所示
代码:response.css('div.blahblah::attr(abc)').extract()
预期输出: [“ somehashvalue”]