如何正确使用beautifulsoup?

时间:2013-06-21 21:43:47

标签: python beautifulsoup

我有一些关于beautifulsoup的一般性问题:

  1. 当我想使用findAll方法并在HTML代码中查找class="pie"时,我该怎么做?类已经是python中的一种方法(我认为这就是所谓的)。当我尝试它时,它给了我一个错误。但是,当我尝试像align="center"这样的例子时,它的效果非常好
  2. 非常相似的问题;如果我想找到特定类型的元标记;比如前<div class="pies"...>我该怎么做? findAll("dir class="pies"")
  3. 提前致谢!

2 个答案:

答案 0 :(得分:1)

class是Python中的关键字,因此您不能这样做:

soup.find_all('div', class='pie')

在关键字参数的末尾添加下划线,它将起作用:

soup.find_all('div', class_='pie')

答案 1 :(得分:1)

另一种方法是将字典中的属性指定为第二个参数。例如:

soup.findAll('div', {'class': 'content'} )
soup.find('div', {'id': 'content'} )
soup.find('meta', { 'property': 'og:image'} )

在你的情况下,你可以做到

soup.findAll('div', { 'class': 'pie'} )