当尝试在div [有28个父div]中提取子div时,xpath不会迭代。
能够获得每个父级div
product_divs=scrap_product_detail_response.xpath("//div[contains(@class,'s-expand-height s-include-content-margin s-border-bottom')]")
print(len(product_divs))
for product_div in product_divs:
img_urls=product_div.xpath("//span[contains(@class,'a-size-base-plus a-color-base a-text-normal')]//text()").extract()
print(img_urls)
当前,输出为 1.jpg 1.jpg 1.jpg
预期: 1.jpg 2.jpg 3.jpg
答案 0 :(得分:1)
product_divs=scrap_product_detail_response.xpath("//div[contains(@class,'s-expand-height s-include-content-margin s-border-bottom')]")
print(len(product_divs))
for product_div in product_divs:
img_urls=product_div.xpath(".//span[contains(@class,'a-size-base-plus a-color-base a-text-normal')]//text()").extract()
print(img_urls)
您已正确编写了所有内容,但留下了相对xpath的(点)