如何使用beautifulsoup在font标签中提取文本

时间:2012-03-24 18:01:55

标签: python screen-scraping web-scraping beautifulsoup

我正在使用beautifulsoup创建我的第一个程序,我的html文件包含这样的代码片段

......
......
......

<font face="verdana" size="3">5 n i D 1 C</font>
......
......

我想从5 n i D 1 C标记中提取<font>。我在做

ele=soup('font', face="verdana",size="3")然后

ele.Contents()

但我收到错误AttributeError: 'ResultSet' object has no attribute 'font' 当我做的时候

 print ele

输出

[<font face="verdana" size="3">5 n i D 1 C</font>]

这意味着它正确搜索,请帮助我如何提取给定的文本。

谢谢

2 个答案:

答案 0 :(得分:3)

ele[0].contents[0]
u'5 n i D 1 C'

答案 1 :(得分:1)

尝试

ele[0].Contents()

而不是

ele.Contents()

ele是ResultSet而不是第一个结果,可能想要检查文档中只返回第一个结果的内容。我对BeautifulSoup不熟悉