BeautifulSoup中是否有一个InnerText等价物?

时间:2012-01-24 20:43:22

标签: python beautifulsoup

使用以下代码:

soup = BeautifulSoup(page.read(), fromEncoding="utf-8")
result = soup.find('div', {'class' :'flagPageTitle'})

我得到以下html:

<div id="ctl00_ContentPlaceHolder1_Item65404" class="flagPageTitle" style=" ">
<span></span><p>Some text here</p>
</div>

如何在没有任何标签的情况下获取Some text here?在BeautifulSoup中是否有相同的InnerText?

3 个答案:

答案 0 :(得分:33)

您只需要:

result = soup.find('div', {'class' :'flagPageTitle'}).text

答案 1 :(得分:3)

您可以使用findAll(text=True)仅查找文本节点。

result = u''.join(result.findAll(text=True))

答案 2 :(得分:2)

您可以搜索<p>并获取其文字:

soup = BeautifulSoup.BeautifulSoup(page.read(), fromEncoding="utf-8")
result = soup.find('div', {'class': 'flagPageTitle'})
result = result.find('p').text