应用错误收集

关于scrapy的并发模型

时间：2012-06-07 03:09:59

标签： scrapy

现在我计划以更分散的方式使用scrapy，而我不是确定是否有蜘蛛/管道/下载/调度程序和引擎所有人都可以共享一些进程或线程关于这个的信息？我们可以改变每个的进程/线程数零件？我知道现在有两个设置“CONCURRENT_REQUESTS”和 “CONCURRENT_ITEMS”，它们将确定并发线程下载和管道，对吧？如果我想部署蜘蛛/ 不同机器中的管道/下载器，我需要序列化物品/要求/回应，对吧？非常感谢您的帮助!!

谢谢，爱德华。

1 个答案:

答案 0 :(得分：4)

Scrapy是单线程的。它使用Reactor pattern来实现并发网络请求。这是使用Twisted框架完成的。

想要分发Scrapy的人通常会尝试实现一些消息传递框架。一些use Redis，其他一些try RabbitMQ

另请查看Scrapyd

关于在OS中运行的程序的并发问题
关于tbb任务
关于scrapy的并发模型
了解Scrapy的CrawlSpider规则
Scrapy的初始化错误
Scrapy的系统性能要求？
使用Scrapy的LinkExtractor
Scrapy的Selector.extract（）已损坏
Scrapy的分页错误
一些关于“帮助gc”的java aqs源代码感到困惑

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？