从HTML提取元素

时间:2018-06-20 09:42:52

标签: python beautifulsoup

我有html:

<div class="img-holder">
 <h1>Sample Image</h1>
 <img src="http://sample.com/img.jpg"/>
</div>

使用:

s = soup.find('div', {'class' : 'img-holder'}).h1
s = s.get_text()

显示“样本图像”。

如何使用相同格式获取图像src?

2 个答案:

答案 0 :(得分:2)

使用img.attrs["src"]

例如:

from bs4 import BeautifulSoup
s = """<div class="img-holder">
 <h1>Sample Image</h1>
 <img src="http://sample.com/img.jpg"/>
</div>"""

soup = BeautifulSoup(s, "html.parser")
s = soup.find('div', {'class' : 'img-holder'})
print( s.img.attrs["src"] )

答案 1 :(得分:0)

喜欢吗?

soup.find('img')['src']