我很难弄清楚如何从我通过BeautifulSoup解析HTML获得的HTML片段中获取某些数据。
这是我的代码:
productpage = 'http://www.sneakersnstuff.com/en/product/26133/adidas-samba-waves-x-naked'
rr = requests.get(productpage)
soup1 = BeautifulSoup(rr.content, 'xml')
productIDArray = soup1.find_all("div", class_="size-button property available")
#print for debugging purposes
print(productIDArray[0])
productIDArray [0]返回
<div class="size-button property available" data-productId="207789">
<span class="size-type" title="UK 3.5 | 36">
US 4
</span>
</div>
我如何获取data-productID的值和span的标题,以便将它们放入变量?
谢谢。
答案 0 :(得分:0)
productIDArray['data-productId']
出:
'207789'
productIDArray.span['title']
出:
'UK 3.5 | 36'