Question

我有这个HTML代码：

<div class="card big_card">
 <h3><a href=""></a></h3>
 <div class="clogo">
 <img src=""><span class="site"><a href="" target="_blank"                                                             title=""></a></span>
</div><p>telephone</b></p>
<p>address</p>   
</div>

我用beautifulsoup编码：

soup = BeautifulSoup(page.text, 'lxml')
for prov in soup.find_all('div', class_="card"):
try:
cur.execute("INSERT INTO provs (name,site,tel,address) VALUES (%s,%s,%s,%s)", (prov.a.get_text(),prov.p.get_text(),prov.b.get_text(),))
print prov.get_text()

解析了第一个“p”标记，但我无法使用地址解析第二个“p”标记。

如何解析下一个“p”标签以及第一个标签？

感谢您的帮助！

Answer 1

cur.execute("INSERT INTO provs (name,site,tel,address) VALUES (%s,%s,%s,%s)", (prov.a.get_text(),prov.p.get_text(),prov.b.get_text(),prov.find_all('p')[-1].get_text(),))

正确答案！

Beautifulsoup：我如何解析下一个<p.text>？

1 个答案: