使用Python和BeautifulSoup使用data-属性刮除div

时间:2018-09-27 12:17:22

标签: python web-scraping beautifulsoup

我必须在python中使用BeautifulSoup抓取一个网页,以便提取具有相关信息的完整div,如下所示:

<div data-v-24a74549="" class="row row-mg-mod term-row">

我写了soup.find('div',{'class':'row row-mg-mod term-row'})。 但是它什么也没返回,我想这与这个data-v值有关。 有人能说出抓取此类数据的确切语法吗?

1 个答案:

答案 0 :(得分:0)

尝试一下:

from bs4 import BeautifulSoup
content = """
<div data-v-24a74549="" class="row  row-mg-mod term-row">"""

soup = BeautifulSoup(content,'html.parser')
for div in soup.find_all("div", {"class" : "row"}):
    print(div)