我正试图在我的本地计算机上通过cygdrive从Windows 8执行nutch 2.2.1。 我按照配置说明操作,这是我在文件夹src中执行的命令:
./ bin / crawl urls / testCrawl / //127.0.0.1:8983/solr/ 1
参数依据: 抓取
solr链接正在我的本地计算机上工作,文件夹urls& testCrawl存在。
我收到了错误消息,我不知道该怎么做:
他-的nutch-2.2.1 / SRC $ ./bin/crawl urls / testCrawl / //127.0.0.1:8181/solr/ 1
cygpath:无法转换空路径
错误:无法找到或加载主类org.apache.nutch.crawl.InjectorJob
我在其他论坛中看到从$ NUTCH_HOME / runtime / local /运行命令但是我根本没有运行时文件夹..我在2.2.1中看到它已被删除并且指令是执行它形成荷兰家庭文件夹
任何人都知道我需要做些什么才能让它发挥作用?可能会改变配置中的某些内容?
由于
答案 0 :(得分:0)
我使用的是OSX,但我对Could not find or load main class ...InjectorJob
也有同样的错误,我相信这是一个脏源目录的结果,在我的情况下,我已经通过Git检查了它,因为我正在尝试各种功能,所以改了几次树枝。因此,您已经运行ant
或ant runtime
来重建运行时/部署目录,但要解决此问题,我必须运行:
ant clean
删除此编译输出,并正确重新编译。在此之后,crawl命令可以正常运行。