如何使用Scrapy绕过cloudflare?

时间:2016-03-09 12:29:05

标签: cloudflare scrapy-spider

是否有任何简单的方法可以绕过Scrapy绕过Cloudflare保护? 我尝试了cloudflare-scrape,但它对我不起作用,仍然会出现403错误。 感谢。

2 个答案:

答案 0 :(得分:0)

403错误通常与您的userAgent有关。尝试将userAgent设置为某些常见浏览器的userAgent(例如' Mozilla')。

答案 1 :(得分:0)

如果您遇到403错误,则可以遵循以下准则;如果您遇到其他问题,请让我知道确切的错误,

转到settings.py

搜索:library(ggplot2) ggplot(data = mtcars, aes( x = factor(gear, labels = c("level 1", "level 2", "level 3")), y = hp)) + geom_boxplot() + stat_boxplot(geom = "errorbar") + xlab("Levels") + stat_summary(fun = mean, geom = "point", shape = 21, size = 2, color = "black", fill = "gray90") + facet_wrap(~vs, scales = "free", ncol = 2) + coord_flip() + theme_bw()

在这里,您将通过scrapy看到默认的bot用户代理。

使用以下内容替换默认设置:

USER_AGENT

您将看到503不再存在。