scrapy上xpath的问题

时间:2016-08-24 01:09:27

标签: python-3.x xpath web-scraping scrapy

我正在使用Scrapy创建一个抓取工具。

我想只提取我将找到的链接的标题。

这是代码的当前部分,对我来说非常重要:

<a class="cor-produto busca-titulo" title="Melhorar a saúde, economia de tempo e dinheiro: Veja os benefícios do uso da bicicleta" href="//g1.globo.com/busca/click?q=economia&amp;p=0&amp;r=1472008380299&amp;u=http%3A%2F%2Fg1.globo.com%2Fma%2Fmaranhao%2Fjmtv-2edicao%2Fvideos%2Fv%2Fmelhorar-a-saude-economia-de-tempo-e-dinheiro-veja-os-beneficios-do-uso-da-bicicleta%2F5256064%2F&amp;t=informacional&amp;d=false&amp;f=false&amp;ss=8bcd843f636c6982&amp;o=&amp;cat=a">Melhorar a saúde, economia de tempo e dinheiro: Veja os benefíc...</a>

我想只提取标题,我需要使用xpath来执行此操作。有人有什么建议吗?

谢谢! :)

1 个答案:

答案 0 :(得分:1)

XPath将是:

//a/@title

sel 您的选择器实例:

sel.xpath('//a/@title').extract()

或者只是来自响应对象:

response.xpath('//a/@title').extract()

<强>输出:

Melhorar a saúde, economia de tempo e dinheiro: Veja os benefícios do uso da bicicleta