我正在尝试在专用的centos 6.10
服务器上运行我的刮板。我安装了python 3.6.6
,创建了venv
,并从scrapyd
安装中安装了运行pip
。命令scrapyd
显示如下:
2018-10-24T12:23:56-0700 [-] Loading /usr/local/lib/python3.6/site-packages/scrapyd/txapp.py...
2018-10-24T12:23:57-0700 [-] Scrapyd web console available at http://127.0.0.1:6800/
2018-10-24T12:23:57-0700 [-] Loaded.
2018-10-24T12:23:57-0700 [twisted.scripts._twistd_unix.UnixAppLogger#info] twistd 18.7.0 (/usr/local/bin/python3.6 3.6.6) starting up.
2018-10-24T12:23:57-0700 [twisted.scripts._twistd_unix.UnixAppLogger#info] reactor class: twisted.internet.epollreactor.EPollReactor.
2018-10-24T12:23:57-0700 [-] Site starting on 6800
2018-10-24T12:23:57-0700 [twisted.web.server.Site#info] Starting factory <twisted.web.server.Site object at 0x7f4661cdf940>
2018-10-24T12:23:57-0700 [Launcher] Scrapyd 1.2.0 started: max_proc=16, runner='scrapyd.runner'
完全酷。现在我有几个问题。
1-如果此命令正在我的专用服务器上运行,是否意味着scrapyd
Web控制台位于[serverIP]:6800
上?或者,至少应该在那里?因为当命令运行时,它不会出现。找不到该网站。所以,我有点撞墙了。
2-另一件事是,我不想让浏览器或SSH终端保持打开状态来运行scrapyd
。我读过的所有文章都建议没有适用于scrapyd
的RPM软件包,直到有人使我运气不佳,因为我个人不是Linux专家,我很惊讶我做到了这一点。 / p>
因此,我想这是将scrapyd
作为守护程序在服务器上运行的问题,因为它需要特殊的文件。我可以直接从git安装scrapyd
吗?但是,即使git似乎也没有这个项目正常运行所需的正确文件。
如果有人可以在正确的道路上为我提供帮助,请指导我或为我提供一篇文章,其中有人在6.10上完成了整个过程,真是太棒了。
答案 0 :(得分:0)
1-使用scrapyd配置文件在其中添加bind_address = 0.0.0.0
# cat ~/.scrapyd.conf
[scrapyd]
bind_address=0.0.0.0
开始scrapyd,您应该会看到类似的东西
2018-11-11T13:58:08-0800 [-] Scrapyd web console available at http://0.0.0.0:6800/
现在您应该可以从[serverIP]:6800访问Web界面
2-您随时可以使用tmux,请阅读https://hackernoon.com/a-gentle-introduction-to-tmux-8d784c404340
答案 1 :(得分:0)
您可以使用@Rene_Xu答案并检查防火墙,以查看其是否断开了外部连接。为了使scrapyd保持活力,您可以编写一个简单的脚本并将其变成守护程序,或者按照here
的说明使用crontab。答案 2 :(得分:0)
还要检查您的专用环境设置,例如,如果您托管在AWS中,则需要设置安全组,网络ACL等,以允许在此特定端口上的传入请求。