在列表中获取元素美丽的汤

时间:2019-12-08 13:24:19

标签: python beautifulsoup

我正在通过chrome使用css选择器来获取网页上的图像,但它返回的列表中包含一个元素,其中包含一个长字符串,其中包含我要查找的元素之一。如何获得带有“ data-src”标签的图像。

我的代码

image = soup.select("#articulo_contenedor > figure > img")

返回

<img alt="En primera fila, de izquierda a derecha: Luis Salvador (alcalde de Granada); Luis Garicano (eurodiputado); Inés Arrimadas (portavoz en el Congreso); Edmundo Bal (portavoz adjunto); Marta Martín (diputada); y Begoña Villacís (vicealcaldesa de Madrid)." data-src="//ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal.jpg" data-srcset="//ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal_recorte1.jpg 1960w, //ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal_recorte2.jpg 720w, //ep01.epimg.net/politica/imagenes/2019/12/07/actualidad/1575740947_516512_1575745986_noticia_normal.jpg 980w" height="600" onload="lzld(this)" src="//ep00.epimg.net/t.gif" srcset="//ep00.epimg.net/t.gif 200w" width="980"/>

但是我要提取第一个“ data-src”

我尝试了很多组合,包括select_one,get_text(),find,findall,但是我一直都没有返回类型。

谢谢

1 个答案:

答案 0 :(得分:1)

这个怎么样?

image = soup.select("#articulo_contenedor > figure > img")
src = image[0]['data-src']