Question

我正在使用 Scrapy 加入 Python2.7 来执行某些任务，但我处理的问题与西班牙语字符类似口音和ñ。问题是我做了一个如下的反应：

response.xpath("//*[contains(@id, 'content')]").css('table').css('tr').css('a')

然后返回以下行：

u'<a href="/C\xf3digo/7">/C\xf3digo/7</a>'

我需要href的内容转到下一页，但格式不正确，Scrapy无法提出请求。

我在文件开头添加了＃ - - coding：utf-8 - - ，我尝试使用 .decode（'utf- 8'）但它不起作用。有人有这个问题，知道如何解决它？我非常感谢你的帮助。

问候。

Answer 1

感谢@Jon Clements，我解决了这个问题。问题是我没有传递提取的hrefs。解决方案是：

response.xpath("//*[contains(@id, 'content')]").css('table').css('tr').css('a::attr(href)')