我是scrapy的新手。我需要使用scrapy进行一个小型演示。
我使用scrapy来刮掉stackoverflow,我成功了。我想在html页面上尝试这个,它存储在我的本地机器上。有可能吗?
请帮帮我
答案 0 :(得分:3)
是的,你可以。只需将允许的域保留为空,然后在start_url中将html文件的位置设为file://home/file.html
。
代码将是这样的
class MySpider(Spider):
name = "myspider"
allowed_domains = []
start_urls = ["file:///home/file.html"]