Scrapy:使用xpath提取文本和超链接文本

时间:2018-09-27 21:17:37

标签: python xpath scrapy

我正在尝试在特定div类中抓取所有段落文本,包括超链接文本。如果我使用以下-

item['body']=response.xpath('//div[@class="example-class"]//p/text()').extract()

这将提取所有段落文本,但不提取其中的超链接。结果如下:

  

要查找更多信息,您可以,然后进一步调查。

但是,如果我按以下方式使用// a代替// p-

item['body']=response.xpath('//div[@class="single-content"]//a/text()').extract()

这将导致提取所有超链接,但不提取任何段落文本。

我知道为什么会这样,但是不确定如何正确提取段落文本和超链接文本。非常感谢你。

0 个答案:

没有答案