使用以下代码:
soup = BeautifulSoup(page.read(), fromEncoding="utf-8")
result = soup.find('div', {'class' :'flagPageTitle'})
我得到以下html:
<div id="ctl00_ContentPlaceHolder1_Item65404" class="flagPageTitle" style=" ">
<span></span><p>Some text here</p>
</div>
如何在没有任何标签的情况下获取Some text here
?在BeautifulSoup
中是否有相同的InnerText?
答案 0 :(得分:33)
您只需要:
result = soup.find('div', {'class' :'flagPageTitle'}).text
答案 1 :(得分:3)
您可以使用findAll(text=True)
仅查找文本节点。
result = u''.join(result.findAll(text=True))
答案 2 :(得分:2)
您可以搜索<p>
并获取其文字:
soup = BeautifulSoup.BeautifulSoup(page.read(), fromEncoding="utf-8")
result = soup.find('div', {'class': 'flagPageTitle'})
result = result.find('p').text