我想编写一个蜘蛛,从我的启动网址上的链接中提取文本,但我不知道如何将我的蜘蛛重定向到链接 我试过这个:
def parse(self, response):
sel = response.xpath("/html/body/main/div[3]/div[1]/div[2]/article/h2/a")
print(sel.xpath("//html/body/main/div[2]/article/div[2]/div[1]/div/p[1]/text()")).extract()
pass
但它不起作用(不打印文本) 有谁知道我做错了什么?
这是我的起始网址
上的链接路径//html/body/main/div[3]/div[1]/div[2]/article/h2/a
这是我要打印的段落
//html/body/main/div[2]/article/div[2]/div[1]/div/p[1]/text()