美丽的汤 - 嵌套表

时间:2015-05-06 13:15:18

标签: python web-scraping beautifulsoup

我首先要指出的是,我对这一切都不熟悉,但却试图找到嵌套的表格单元格。

以下是我试图绕过第282行的平方英尺字段:view-source:http://services.wakegov.com/realestate/Account.asp?id=0355891

'square_feet': soup.findAll('table')[10].findAll('tr')[15].get_text().strip(),

我收到的错误是:

  

IndexError:列表索引超出范围

1 个答案:

答案 0 :(得分:1)

更可读和简单的方法是依赖参数标签 - 换句话说,按文本查找元素,获取父td元素并找到下一个td兄弟元素,例如:

soup.find(text="Heated Area").find_parent('td').find_next_sibling("td").get_text()