我有这个范围,我想得到标题
<span title="Something"></span>
如何用beautifulsoup得到它?
res = soup.find('span')
print res //Was trying to add res.title but result is 'None'
答案 0 :(得分:10)
您应该能够像这样访问它:
res = soup.find('span')['title']
编辑:我想澄清一下,res将是title属性的值。如果您希望稍后使用该元素,请将我的代码更改为:
res = soup.find('span')
title = res['title']
然后你可以继续使用res
(如果需要)。
此外,.find
将返回单个元素。您需要确保它是您想要的范围,因为HTML可能有多个范围。
答案 1 :(得分:0)
这是文档的内容:
soup.findAll(['title', 'p'])
# [<title>Page title</title>,
# <p id="firstpara" align="center">This is paragraph <b>one</b>.</p>,
# <p id="secondpara" align="blah">This is paragraph <b>two</b>.</p>]
soup.findAll({'title' : True, 'p' : True})
# [<title>Page title</title>,
# <p id="firstpara" align="center">This is paragraph <b>one</b>.</p>,
# <p id="secondpara" align="blah">This is paragraph <b>two</b>.</p>]
您也可以使用正则表达式。