如何使用BeautifulSoup获取嵌套标记的内容

时间:2014-01-07 21:35:40

标签: beautifulsoup

如何使用BeautifulSoup获取结束范围标记之前的数字?

<span class="count">
<i class="icon-user"></i>
30.5K </span>

我可以使用:

usercount=soup.findAll('span',{'class':'count'})

但不是:

usercount=soup.findAll('i',{'class':'count'})

1 个答案:

答案 0 :(得分:0)

您所追求的文字是<i><span>之后的文字节点:

import bs4

soup = bs4.BeautifulSoup('''
    <span class="count">
    <i class="icon-user"></i>
    30.5K </span>
''')

usercount = soup.find('span', class_='count').find('i').next.strip()