为什么我的解析器不工作

时间:2015-07-21 21:55:31

标签: python web-scraping beautifulsoup python-requests

我试图从这个网站上抓取目录信息。 'http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478'

但我不知道如何选择不同的文本行,因为它们的唯一标签是换行元素(
)。有没有办法可以通过文本而不是标签进行搜索?

r=requests.get('http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478')
soup=BeautifulSoup(r.content,'lxml')
tbl=soup.findAll('table')[2]
print tbl.br

1 个答案:

答案 0 :(得分:0)

您要查找的文字位于表格内的第二个TR中。所以,

print tbl.findAll('tr')[2]

然而,该文本中确实没有任何好的结构,所以你可以自己获取联系人姓名等。