使用Scrapy无法从父div获取子xpath

时间:2019-04-19 16:27:40

标签: python-2.7 web-scraping scrapy python-3.6

当尝试在div [有28个父div]中提取子div时,xpath不会迭代。

能够获得每个父级div

product_divs=scrap_product_detail_response.xpath("//div[contains(@class,'s-expand-height s-include-content-margin s-border-bottom')]")
print(len(product_divs))
for product_div in product_divs:
    img_urls=product_div.xpath("//span[contains(@class,'a-size-base-plus a-color-base a-text-normal')]//text()").extract()
    print(img_urls)

当前,输出为 1.jpg 1.jpg 1.jpg

预期: 1.jpg 2.jpg 3.jpg

1 个答案:

答案 0 :(得分:1)

product_divs=scrap_product_detail_response.xpath("//div[contains(@class,'s-expand-height s-include-content-margin s-border-bottom')]")
print(len(product_divs))
for product_div in product_divs:
    img_urls=product_div.xpath(".//span[contains(@class,'a-size-base-plus a-color-base a-text-normal')]//text()").extract()
    print(img_urls)

您已正确编写了所有内容,但留下了相对xpath的(点)