我有这个HTML代码:
<div class="card big_card">
<h3><a href=""></a></h3>
<div class="clogo">
<img src=""><span class="site"><a href="" target="_blank" title=""></a></span>
</div><p>telephone</b></p>
<p>address</p>
</div>
我用beautifulsoup编码:
soup = BeautifulSoup(page.text, 'lxml')
for prov in soup.find_all('div', class_="card"):
try:
cur.execute("INSERT INTO provs (name,site,tel,address) VALUES (%s,%s,%s,%s)", (prov.a.get_text(),prov.p.get_text(),prov.b.get_text(),))
print prov.get_text()
解析了第一个“p”标记,但我无法使用地址解析第二个“p”标记。
如何解析下一个“p”标签以及第一个标签?
感谢您的帮助!
答案 0 :(得分:0)
cur.execute("INSERT INTO provs (name,site,tel,address) VALUES (%s,%s,%s,%s)", (prov.a.get_text(),prov.p.get_text(),prov.b.get_text(),prov.find_all('p')[-1].get_text(),))
正确答案!