使用beautifulsoup获取span标题

时间:2012-10-19 21:30:04

标签: python python-2.7 beautifulsoup

我有这个范围,我想得到标题

<span title="Something"></span>

如何用beautifulsoup得到它?

res = soup.find('span')
print res //Was trying to add res.title but result is 'None'

2 个答案:

答案 0 :(得分:10)

您应该能够像这样访问它:

res = soup.find('span')['title']

Docs

编辑:我想澄清一下,res将是title属性的值。如果您希望稍后使用该元素,请将我的代码更改为:

res = soup.find('span')
title = res['title']

然后你可以继续使用res(如果需要)。

此外,.find将返回单个元素。您需要确保它是您想要的范围,因为HTML可能有多个范围。

答案 1 :(得分:0)

这是文档的内容:

soup.findAll(['title', 'p'])
# [<title>Page title</title>, 
#  <p id="firstpara" align="center">This is paragraph <b>one</b>.</p>, 
#  <p id="secondpara" align="blah">This is paragraph <b>two</b>.</p>]

soup.findAll({'title' : True, 'p' : True})
# [<title>Page title</title>, 
#  <p id="firstpara" align="center">This is paragraph <b>one</b>.</p>, 
#  <p id="secondpara" align="blah">This is paragraph <b>two</b>.</p>]

您也可以使用正则表达式。