apache nutch 2.2.1执行错误

时间:2014-08-17 13:44:27

标签: nutch

我正试图在我的本地计算机上通过cygdrive从Windows 8执行nutch 2.2.1。 我按照配置说明操作,这是我在文件夹src中执行的命令:

./ bin / crawl urls / testCrawl / //127.0.0.1:8983/solr/ 1

参数依据:  抓取

solr链接正在我的本地计算机上工作,文件夹urls& testCrawl存在。

我收到了错误消息,我不知道该怎么做:

他-的nutch-2.2.1 / SRC $ ./bin/crawl urls / testCrawl / //127.0.0.1:8181/solr/ 1

cygpath:无法转换空路径

错误:无法找到或加载主类org.apache.nutch.crawl.InjectorJob

我在其他论坛中看到从$ NUTCH_HOME / runtime / local /运行命令但是我根本没有运行时文件夹..我在2.2.1中看到它已被删除并且指令是执行它形成荷兰家庭文件夹

任何人都知道我需要做些什么才能让它发挥作用?可能会改变配置中的某些内容?

由于

1 个答案:

答案 0 :(得分:0)

我使用的是OSX,但我对Could not find or load main class ...InjectorJob也有同样的错误,我相信这是一个脏源目录的结果,在我的情况下,我已经通过Git检查了它,因为我正在尝试各种功能,所以改了几次树枝。因此,您已经运行antant runtime来重建运行时/部署目录,但要解决此问题,我必须运行:

ant clean

删除此编译输出,并正确重新编译。在此之后,crawl命令可以正常运行。