Windows上的portia(scrapy / slybot)错误

时间:2014-04-05 13:15:14

标签: python-2.7 scrapy scrapinghub portia

我安装了portia并让它工作我注释了一些网站(看起来非常好) 但当我尝试运行蜘蛛时,我得到一些错误,没有任何东西被抓获 我在win 7上运行python 2.7.6

C:\Python27\Scripts>python portiacrawl C:\portia\slyd\data\projects\new_project
Traceback (most recent call last):
File "portiacrawl", line 7, in <module>
execfile(__file__)
File "C:\portia\slybot\bin\portiacrawl", line 56, in <module>
main()
File "C:\portia\slybot\bin\portiacrawl", line 54, in main
subprocess.call(command_spec)
File "C:\Python27\lib\subprocess.py", line 522, in call
return Popen(*popenargs, **kwargs).wait()
File "C:\Python27\lib\subprocess.py", line 709, in __init__
errread, errwrite)
File "C:\Python27\lib\subprocess.py", line 957, in _execute_child
startupinfo)
WindowsError: [Error 2] O sistema nÒo conseguiu localizar o ficheiro especificado

1 个答案:

答案 0 :(得分:0)

我正在Windows 8.1上对portia进行故障排除,并且遇到了同样的错误。 尝试单独运行'python portiacrawl'以确定是否有后续菜单。您应该能够看到关于'portiacrawl'的帮助信息。我怀疑你需要命名[蜘蛛]&amp; [options]以及更改终端目录以查看爬虫的输出。

我建议尝试以下方法,但将[spider]重命名为蜘蛛的实际名称,不带括号:

  1. 进入终端:C:\ portia \ slyd \ data \ projects&lt; ------更改为cmd中的正确目录
  2. 确保您位于终端目录“C:\ portia \ slyd \ data \ projects”中 Cmd推荐应该如下所示:C:\ portia \ slyd \ data \ projects&gt; &lt; ----等待portia的启动。
  3. 进入终端:
    python portiacrawl C:\ portia \ slyd \ data \ projects \ new_project [spider] -t csv -o test.csv;
    或,
    python portiacrawl [spider] -t csv -o test.csv

  4. 报告回来。我很好奇终端的回应。它是否启动了portiacrawl&amp;返回“访问被拒绝。”