Beautifulsoup获取类名后面的属性

时间:2017-02-24 18:26:58

标签: python-2.7 web-scraping beautifulsoup

我在前言中说我对美丽的汤比较新。我理解以下一行:

soup.find_all('div', class_ = 'favorite_links')[0] 

将获取第一个div标签的全部内容,其中class = favorite-links。然而,我真正想要的是紧靠类名右侧的文本:

    <div class="favorite-links" data-can-favorite="" data-id="10820653">
</div>

我希望获得的是data-id之后的数字。有没有办法做到这一点?我绝对可以使用字符串操作,但我想知道是否有办法专门使用BeautifulSoup

提前抱歉我的术语不好。正如我之前所说,我对BeautifulSoup相对较新。

谢谢!

1 个答案:

答案 0 :(得分:1)

Seq