如何使用二进制逻辑选择标签?

时间:2018-09-27 21:18:04

标签: python beautifulsoup

我有一个这样的结构:(不是这个特定的顺序)

...
<div class="class1 class2">whatever</div>
<div class="class1">whatever</div>
<div class="class1">whatever</div>
<div class="class1 class2">whatever</div>
...

如何仅获取/查找class =“ class1”而不是class =“ class1 class2”的“ div”标签

当前,我正在使用find_all来获取带有class _ =“ class1”的“ div”列表(包括不需要的“ class2”)和另一个class _ =“ class2”的列表,以及它们之间的区别。但这真是愚蠢,我相信比我聪明的人可以使用BS4中的适当find参数来完成它。

我感谢任何评论和想法。 最好的问候,

1 个答案:

答案 0 :(得分:0)

这个简单的代码应该做到

from bs4 import BeautifulSoup
import requests

url = "www.website.com/page.html"
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
tags = soup.select('div#class1')

希望有帮助!