使用BS4从HTML中获取值

时间:2017-02-07 19:31:13

标签: python html beautifulsoup python-requests

我很难弄清楚如何从我通过BeautifulSoup解析HTML获得的HTML片段中获取某些数据。

这是我的代码:

productpage = 'http://www.sneakersnstuff.com/en/product/26133/adidas-samba-waves-x-naked'
rr = requests.get(productpage)
soup1 = BeautifulSoup(rr.content, 'xml')
productIDArray = soup1.find_all("div", class_="size-button property available")

#print for debugging purposes
print(productIDArray[0])

productIDArray [0]返回

<div class="size-button property available" data-productId="207789">
<span class="size-type" title="UK 3.5 | 36">
    US 4

        </span>
</div>

我如何获取data-productID的值和span的标题,以便将它们放入变量?

谢谢。

1 个答案:

答案 0 :(得分:0)

productIDArray['data-productId']

出:

'207789'
productIDArray.span['title']

出:

'UK 3.5 | 36'