我不熟悉数据抓取,并且正在使用BeautifulSoup
来抓取网页中的某些数据。
我要做的是以下
all = soup.find_all("span",{"class":"compare-property"})
arg=all[0]
print(arg)
输出为:
< span class="compare-property" data-placement="top" data-propid="1858251" data-toggle="tooltip" id="compare-link-1858251" title="Bera saman">
< i class="fa fa-plus"></i>
< /span>'
现在我需要一个名为data-propid
的数字,在示例中为1858251
我怎么得到那个号码?
答案 0 :(得分:1)
您可以仅访问元素的属性。
all = soup.find_all("span",{"class":"compare-property"})
arg=all[0]
print(arg['data-propid'])
答案 1 :(得分:1)
您应该使用
all[0]['data-propid']
问候 凯丹妮斯
答案 2 :(得分:1)
在这里查看漂亮的汤文档: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
您要
for link in soup.find_all("span",{"class":"compare-property"}):
print(link.get('data-propid'))