我是Apache Nut的新手,并尝试使用python获取基本的Nut Crawler设置。我以https://github.com/chrismattmann/nutch-python/wiki为基础,尝试弄清基本的内容检索和检索工作原理。因此,除了本教程所建议的以外,我什么也没做。克隆git存储库并使用ANT成功构建运行时xml之后,我尝试运行python程序。但是它给了我以下信息:
nutch.nutch.NutchException: Unexpected server response: 405
回溯如下:
Traceback (most recent call last):
File "nutch123.py", line 15, in <module>
nt = Nutch('default')
File "/Users/Desktop/nutchtrial/venv/lib/python3.6/site-packages/nutch/nutch.py", line 636, in __init__
self.config['http.agent.name'] = DefaultUserAgent
File "/Users/Desktop/nutchtrial/venv/lib/python3.6/site-packages/nutch/nutch.py", line 252, in __setitem__
self.server.call('post', '/config/%s' % self.id, postArgs, forceText=True)
File "/Users/Desktop/nutchtrial/venv/lib/python3.6/site-packages/nutch/nutch.py", line 160, in call
raise error
nutch.nutch.NutchException: Unexpected server response: 405
这似乎是我声明Nutch的方式,但是我也查看了github问题和响应以及其他组,我的声明方法似乎是正确的。
有没有一种方法可以解决此问题?
谢谢