Apache Nuch 1.15安装和运行问题

时间:2019-04-29 00:31:53

标签: hadoop nutch

我试图在Windows 10上运行Apache Nutch 1.15(本地),我已经按照https://wiki.apache.org/nutch/NutchTutorialhttps://wiki.apache.org/nutch/NutchHadoopSingleNodeTutorial所述的相同步骤进行操作。 当我尝试在cygwin上使用此命令注入URL时:bin / nutch注入crawl / crawldb url,我得到此错误:

Injector: java.io.IOException: (null) entry in command string: null chmod 
0644 C:\Users\INFO\Desktop\apache-nutch1.15\runtime\local\crawl\crawldb\.locked

%HADOOP_HOME%放在系统路径上(在Apache Nutch error: Injector: java.io.IOException: (null) entry in command string: null chmod 0644上提出了解决方案)

我收到一个新错误:

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

通过作为HADOOP_HOME的方式,我尝试了hadoop-2.8.0和winutil文件夹,但存在相同的问题。

请帮助。

2 个答案:

答案 0 :(得分:0)

我遇到了最后一个问题,您解决了吗? 我尝试了很多方法来解决它,但总是失败。

答案 1 :(得分:0)

这是一个已知的问题。请在下面找到JIRA和修复程序。如果您将GIT中的更改应用到本地bin / nutch文件中,一切将再次正常运行。当螺母1.16释放时,它将作为修复程序包括在内

JIRA:https://issues.apache.org/jira/browse/NUTCH-2639?page=com.atlassian.jira.plugin.system.issuetabpanels%3Aall-tabpanel

FIX:https://github.com/apache/nutch/pull/378/commits/7e4502089ecebd194c75719485b6fce1a65797e9