获取美丽汤的内容

时间:2011-08-11 14:48:46

标签: python beautifulsoup

我正在尝试获取文档中特定<td>标记的内容。目前我的代码看起来像这样

对于行中的行:

 data = row.findAll('td')
  for col in data:
      if col.string == 'Address':
         address = col.findNext('td')
         print address

控制台上的打印地址显示:

<td> 
Victoria Park Ave & McNicoll Ave, Toronto, ON M1W 3Y3, Canada
<br /> <a class="viewmap-link" href="/c-ViewMap?AdId=299616106">View map</a> 
</td> 

我试图在我尝试<br/>的“地址”中的address.string标记之前获取所有内容,但它返回“无”。

1 个答案:

答案 0 :(得分:0)

使用Tag.getText()方法

data = row.findAll('td')
  for col in data:
    if col.string == 'Address':
      address = col.findNext('td')
      print address.getText()

编辑:获取所有文字,而不仅仅是<br>之前。尝试尝试这个

data = row.findAll('td')
  for col in data:
    if col.string == 'Address':
      address = col.findNext('td')
      print address.contents[0]