从python中的span类获取数据

时间:2019-02-21 15:36:07

标签: python web-scraping beautifulsoup

我不熟悉数据抓取,并且正在使用BeautifulSoup来抓取网页中的某些数据。

我要做的是以下

all = soup.find_all("span",{"class":"compare-property"})

arg=all[0]

print(arg)

输出为:

< span class="compare-property" data-placement="top" data-propid="1858251"    data-toggle="tooltip" id="compare-link-1858251" title="Bera saman">
< i class="fa fa-plus"></i>
< /span>'

现在我需要一个名为data-propid的数字,在示例中为1858251 我怎么得到那个号码?

3 个答案:

答案 0 :(得分:1)

您可以仅访问元素的属性。

all = soup.find_all("span",{"class":"compare-property"})

arg=all[0]

print(arg['data-propid'])

答案 1 :(得分:1)

您应该使用

all[0]['data-propid']

问候 凯丹妮斯

答案 2 :(得分:1)

在这里查看漂亮的汤文档: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

您要

for link in soup.find_all("span",{"class":"compare-property"}):
    print(link.get('data-propid'))