如果我使用网页底部给出的下一个按钮,则它会打开一个网页,而不是通过在新标签上复制其CSS选择器的href属性中的URL来打开网页
我正在用刮板做刮板。这是起始网址:
https://www.flipkart.com/search?q=laptops&otracker=search&otracker1=search&marketplace=FLIPKART&as-show=on&as=off
。
Spider可以正常工作到第18页。从第18页开始,它转到的网页与使用下一步按钮应该转到的网页不同。为了检查问题,我手动尝试使用href中的链接打开网页,但登陆到了另一个网页。
以下是打开抓取下一个网页的代码-
if Spider_king.count<max_laptops:
Spider_king.page_number+=1
if Spider_king.page_number==2:
Spider_king.css_selector='a._3fVaIS'
else:
Spider_king.css_selector='a._3fVaIS:nth-child(12)'
next_page=response.css(Spider_king.css_selector+'::attr(href)').get()
yield response.follow(next_page,callback=self.parse)