Beautifulsoup获取用逗号分隔的hrefs的值

时间:2017-10-23 20:09:46

标签: python-2.7 beautifulsoup

sup2 = soup2.find_all("div", {"class": "xxxxxxx"})

当我在div上使用find_all时,我得到以下结果

<div class="xxxxxxx" data-reactid="37"><a href="/zz/aa">aa </a>, <a href="/xx/yy">bb </a></div>

如何在这两个逗号之间获取href

1 个答案:

答案 0 :(得分:0)

迭代Tag中的sup2元素并选择'href'属性,例如:

hrefs = [a['href'] for tag in sup2 for a in tag.find_all('a')]

使用css选择器:

hrefs = [tag['href'] for tag in soup2.select("div.xxxxxxx a")]