Question

我试图从这个网站上抓取目录信息。 'http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478'

但我不知道如何选择不同的文本行，因为它们的唯一标签是换行元素（
）。有没有办法可以通过文本而不是标签进行搜索？

r=requests.get('http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478')
soup=BeautifulSoup(r.content,'lxml')
tbl=soup.findAll('table')[2]
print tbl.br

Answer 1

您要查找的文字位于表格内的第二个TR中。所以，

print tbl.findAll('tr')[2]

然而，该文本中确实没有任何好的结构，所以你可以自己获取联系人姓名等。

为什么我的解析器不工作

1 个答案: