Question

我很难弄清楚如何从我通过BeautifulSoup解析HTML获得的HTML片段中获取某些数据。

这是我的代码：

productpage = 'http://www.sneakersnstuff.com/en/product/26133/adidas-samba-waves-x-naked'
rr = requests.get(productpage)
soup1 = BeautifulSoup(rr.content, 'xml')
productIDArray = soup1.find_all("div", class_="size-button property available")

#print for debugging purposes
print(productIDArray[0])

productIDArray [0]返回

<div class="size-button property available" data-productId="207789">
<span class="size-type" title="UK 3.5 | 36">
    US 4

        </span>
</div>

我如何获取data-productID的值和span的标题，以便将它们放入变量？

谢谢。

Answer 1

productIDArray['data-productId']

出：

'207789'

productIDArray.span['title']

出：

'UK 3.5 | 36'

使用BS4从HTML中获取值

1 个答案: