sup2 = soup2.find_all("div", {"class": "xxxxxxx"})
当我在div上使用find_all时,我得到以下结果
<div class="xxxxxxx" data-reactid="37"><a href="/zz/aa">aa </a>, <a href="/xx/yy">bb </a></div>
如何在这两个逗号之间获取href
答案 0 :(得分:0)
迭代Tag
中的sup2
元素并选择'href'属性,例如:
hrefs = [a['href'] for tag in sup2 for a in tag.find_all('a')]
使用css选择器:
hrefs = [tag['href'] for tag in soup2.select("div.xxxxxxx a")]