我可以使用scrapy刮取本地机器的html页面吗?

时间:2016-02-17 08:57:21

标签: python scrapy

我是scrapy的新手。我需要使用scrapy进行一个小型演示。

我使用scrapy来刮掉stackoverflow,我成功了。我想在html页面上尝试这个,它存储在我的本地机器上。有可能吗?

请帮帮我

1 个答案:

答案 0 :(得分:3)

是的,你可以。只需将允许的域保留为空,然后在start_url中将html文件的位置设为file://home/file.html。 代码将是这样的

class MySpider(Spider):
    name = "myspider"
    allowed_domains = []
    start_urls = ["file:///home/file.html"]