我正在使用Scrapy创建一个抓取工具。
我想只提取我将找到的链接的标题。
这是代码的当前部分,对我来说非常重要:
<a class="cor-produto busca-titulo" title="Melhorar a saúde, economia de tempo e dinheiro: Veja os benefícios do uso da bicicleta" href="//g1.globo.com/busca/click?q=economia&p=0&r=1472008380299&u=http%3A%2F%2Fg1.globo.com%2Fma%2Fmaranhao%2Fjmtv-2edicao%2Fvideos%2Fv%2Fmelhorar-a-saude-economia-de-tempo-e-dinheiro-veja-os-beneficios-do-uso-da-bicicleta%2F5256064%2F&t=informacional&d=false&f=false&ss=8bcd843f636c6982&o=&cat=a">Melhorar a saúde, economia de tempo e dinheiro: Veja os benefíc...</a>
我想只提取标题,我需要使用xpath来执行此操作。有人有什么建议吗?
谢谢! :)
答案 0 :(得分:1)
XPath将是:
//a/@title
sel 您的选择器实例:
sel.xpath('//a/@title').extract()
或者只是来自响应对象:
response.xpath('//a/@title').extract()
<强>输出:强>
Melhorar a saúde, economia de tempo e dinheiro: Veja os benefícios do uso da bicicleta