应用错误收集

我想编写一个蜘蛛，从我的启动网址上的链接中提取文本，但我不知道如何将我的蜘蛛重定向到链接我试过这个：

    def parse(self, response):

        sel = response.xpath("/html/body/main/div[3]/div[1]/div[2]/article/h2/a")
        print(sel.xpath("//html/body/main/div[2]/article/div[2]/div[1]/div/p[1]/text()")).extract()
        pass

但它不起作用（不打印文本）有谁知道我做错了什么？

这是我的起始网址

上的链接路径

//html/body/main/div[3]/div[1]/div[2]/article/h2/a

这是我要打印的段落

//html/body/main/div[2]/article/div[2]/div[1]/div/p[1]/text()

scrapy如何从起始URL的子页面抓取文本

0 个答案: