Question

我必须在python中使用BeautifulSoup抓取一个网页，以便提取具有相关信息的完整div，如下所示：

<div data-v-24a74549="" class="row row-mg-mod term-row">

我写了soup.find('div',{'class':'row row-mg-mod term-row'})。但是它什么也没返回，我想这与这个data-v值有关。有人能说出抓取此类数据的确切语法吗？

Answer 1

尝试一下：

from bs4 import BeautifulSoup
content = """
<div data-v-24a74549="" class="row  row-mg-mod term-row">"""

soup = BeautifulSoup(content,'html.parser')
for div in soup.find_all("div", {"class" : "row"}):
    print(div)

使用Python和BeautifulSoup使用data-属性刮除div

1 个答案: