我正在通过chrome使用css选择器来获取网页上的图像,但它返回的列表中包含一个元素,其中包含一个长字符串,其中包含我要查找的元素之一。如何获得带有“ data-src”标签的图像。
我的代码
image = soup.select("#articulo_contenedor > figure > img")
返回
<img alt="En primera fila, de izquierda a derecha: Luis Salvador (alcalde de Granada); Luis Garicano (eurodiputado); Inés Arrimadas (portavoz en el Congreso); Edmundo Bal (portavoz adjunto); Marta Martín (diputada); y Begoña Villacís (vicealcaldesa de Madrid)." data-src="//ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal.jpg" data-srcset="//ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal_recorte1.jpg 1960w, //ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal_recorte2.jpg 720w, //ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal.jpg 980w" height="600" onload="lzld(this)" src="//ep00.epimg.net/t.gif" srcset="//ep00.epimg.net/t.gif 200w" width="980"/>
但是我要提取第一个“ data-src”
我尝试了很多组合,包括select_one,get_text(),find,findall,但是我一直都没有返回类型。
谢谢
答案 0 :(得分:1)
这个怎么样?
image = soup.select("#articulo_contenedor > figure > img")
src = image[0]['data-src']