选择嵌套元素与美丽的汤

时间:2014-08-05 19:04:39

标签: python html beautifulsoup

我有以下html:

<div class="leftColumn">
  <div>
     <div class="static">
     text1
     <br>
     text2
     <br>
     (222) 123 - 4567
     <br>
     <div class="summary">

如何使用漂亮的汤选择文本行。

我尝试过各种各样的事情:

soup.select('.leftColumn div').text

但到目前为止没有骰子

2 个答案:

答案 0 :(得分:2)

Mauro的回答可能更符合您的要求,但这是另一种方式,以及我如何考虑获取内部div文本:

from bs4 import BeautifulSoup
html = '''<div class="leftColumn">
  <div>
     <div class="static">
     text1
     <br>
     text2
     <br>
     (222) 123 - 4567
     <br>
     <div class="summary">
     '''
bs = BeautifulSoup(html)
for div in bs.findAll('div', attrs={'class': 'leftColumn'}):
    print div.findNext('div').findNext('div').text

答案 1 :(得分:1)

BeautifulSoup select检索列表。您必须指定索引。

soup.select('.leftColumn div')[0].text.split()