Question

我正在使用Scrapy创建一个抓取工具。

我想只提取我将找到的链接的标题。

这是代码的当前部分，对我来说非常重要：

<a class="cor-produto busca-titulo" title="Melhorar a saúde, economia de tempo e dinheiro: Veja os benefícios do uso da bicicleta" href="//g1.globo.com/busca/click?q=economia&amp;p=0&amp;r=1472008380299&amp;u=http%3A%2F%2Fg1.globo.com%2Fma%2Fmaranhao%2Fjmtv-2edicao%2Fvideos%2Fv%2Fmelhorar-a-saude-economia-de-tempo-e-dinheiro-veja-os-beneficios-do-uso-da-bicicleta%2F5256064%2F&amp;t=informacional&amp;d=false&amp;f=false&amp;ss=8bcd843f636c6982&amp;o=&amp;cat=a">Melhorar a saúde, economia de tempo e dinheiro: Veja os benefíc...</a>

我想只提取标题，我需要使用xpath来执行此操作。有人有什么建议吗？

谢谢！：）

Answer 1

XPath将是：

//a/@title

sel 您的选择器实例：

sel.xpath('//a/@title').extract()

或者只是来自响应对象：

response.xpath('//a/@title').extract()

<强>输出：

Melhorar a saúde, economia de tempo e dinheiro: Veja os benefícios do uso da bicicleta

scrapy上xpath的问题

1 个答案: