我首先要指出的是,我对这一切都不熟悉,但却试图找到嵌套的表格单元格。
以下是我试图绕过第282行的平方英尺字段:view-source:http://services.wakegov.com/realestate/Account.asp?id=0355891
'square_feet': soup.findAll('table')[10].findAll('tr')[15].get_text().strip(),
我收到的错误是:
IndexError:列表索引超出范围
答案 0 :(得分:1)
更可读和简单的方法是依赖参数标签 - 换句话说,按文本查找元素,获取父td
元素并找到下一个td
兄弟元素,例如:
soup.find(text="Heated Area").find_parent('td').find_next_sibling("td").get_text()