如何提取我的抓取工具当前所在的网址?

时间:2016-11-27 00:31:23

标签: python scrapy web-crawler

我正在使用python中的scrapy框架创建一个Web爬虫。 主要思想是爬虫从页面中提取一些数据,如果数据符合某些条件,则爬虫应提取其当前所在的URL。 在scrappy中是否有一些获取当前URL的方法/函数?

感谢。

1 个答案:

答案 0 :(得分:2)

响应'传递给parse()的变量具有您想要的信息。你不应该覆盖任何东西。

例如

def parse(self, response):
    print "URL: " + response.url