提取没有class属性的元素

时间:2012-01-30 08:21:20

标签: python beautifulsoup

我需要导航到特定类型的html元素。 但是,页面上有许多这种类型的元素,有许多不同的类。

我需要一个没有任何类属性

我应该找一个class == '',还是其他方式?

2 个答案:

答案 0 :(得分:41)

使用

soup.findAll(attrs={'class': None})

从文档引用:

  

如果需要对名称为Python保留字的属性(如class,for或import)设置限制,则可以使用attrs;或其名称为Beautiful Soup搜索方法的非关键字参数的属性:name,recursive,limit,text或attrs本身。

答案 1 :(得分:6)

Beautiful Soup version 4.1.2开始,您可以使用class_ keyword argument

要选择没有class属性的元素,您只需指定None

soup.find_all(class_=None)

或者,指定False也有效:

soup.find_all(class_=False)