我有一个这样的结构:(不是这个特定的顺序)
...
<div class="class1 class2">whatever</div>
<div class="class1">whatever</div>
<div class="class1">whatever</div>
<div class="class1 class2">whatever</div>
...
如何仅获取/查找class =“ class1”而不是class =“ class1 class2”的“ div”标签
当前,我正在使用find_all来获取带有class _ =“ class1”的“ div”列表(包括不需要的“ class2”)和另一个class _ =“ class2”的列表,以及它们之间的区别。但这真是愚蠢,我相信比我聪明的人可以使用BS4中的适当find参数来完成它。
我感谢任何评论和想法。 最好的问候,
答案 0 :(得分:0)
这个简单的代码应该做到
from bs4 import BeautifulSoup
import requests
url = "www.website.com/page.html"
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
tags = soup.select('div#class1')
希望有帮助!