报废的苹果网站

时间:2018-11-19 13:29:26

标签: python scrapy scrapy-spider

我试图从下面的链接中获得模型以及价格,但是没有运气,请您告诉我哪里出了问题以及如何将这两个零件报废?

https://www.apple.com/shop/buy-ipad/ipad-pro

这是我尝试过的:

起价$ 799

获取“发件人”字词

response.xpath('//span[@class="as-price-currentprice"]/text()').extract()

[]


要获取价格本身,请执行以下操作:

response.xpath('//span[@class="nowrap"]/text()').extract()

[u'1\u2011800\u2011MY\u2011APPLE.', u'1\u2011800\u2011MY\u2011APPLE.', u'Visit an ', u'call ', u', or ']


模型

顺便说一句,我根本无法获得模型

11英寸iPad Pro

12.9英寸iPad Pro

2 个答案:

答案 0 :(得分:2)

这是您可以执行的操作:

headers = response.css('.pd-billboard-subheader::text').getall()
prices = response.css('.pd-billboard-price::text').getall()

result = []
for header, price in zip(headers, prices):
    header_cleaned = header.replace('\xa0', ' ')
    price_cleaned = price.replace('\n', '').replace('        ', '').strip()
    result.append([header_cleaned, price_cleaned])

此后,结果将等于:

[['12.9-inch iPad Pro', 'From $999'],
 ['11-inch iPad Pro', 'From $799'],
 ['10.5-inch iPad Pro', 'From $649'],
 ['iPad', 'From $329'],
 ['iPad mini 4', 'From $399']]

答案 1 :(得分:0)

查看网站返回的原始HTML(右键单击>“查看源代码”)。

Raw HTML

如您所见,页面只是由某些Javascript代码动态呈现的模板。

当您查看Web浏览器开发人员工具时,该Javascript已执行,因此您将看到最终呈现的HTML,因此请确保查看原始HTML。