python - 从网站获取每个div类和div id

时间:2018-01-13 20:14:09

标签: python lxml

所以有一些尝试,但我找不到获取每个

的名称和内容的方法
  • div class
  • div id

我在我的项目中使用lxml和beautysoup,但我似乎无法找到找到我不知道的div的方法。 有人可以告诉我一个方法或任何提示如何做到这一点?

提前致谢。

1 个答案:

答案 0 :(得分:2)

您可以使用find_all方法查找特定类型的所有标记,然后通过attrs dict查看其属性,例如:

soup = BeautifulSoup(html, 'lxml')
for div in soup.find_all('div'):
  print(div.attrs)