scrapy如何从起始URL的子页面抓取文本

时间:2016-10-14 22:19:55

标签: python scrapy

我想编写一个蜘蛛,从我的启动网址上的链接中提取文本,但我不知道如何将我的蜘蛛重定向到链接 我试过这个:

    def parse(self, response):

        sel = response.xpath("/html/body/main/div[3]/div[1]/div[2]/article/h2/a")
        print(sel.xpath("//html/body/main/div[2]/article/div[2]/div[1]/div/p[1]/text()")).extract()
        pass

但它不起作用(不打印文本) 有谁知道我做错了什么?

这是我的起始网址

上的链接路径
//html/body/main/div[3]/div[1]/div[2]/article/h2/a

这是我要打印的段落

//html/body/main/div[2]/article/div[2]/div[1]/div/p[1]/text()

0 个答案:

没有答案