我在拥有java 1.8的Windows 10上使用Apache Nutch 1.14。我遵循了https://wiki.apache.org/nutch/NutchTutorial中提到的相同步骤。
当我尝试使用cygwin上的命令在crawldb中注入URL时:bin / nutch inject crawl / crawldb urls
我收到以下错误: Injector:java.io.IOException :( null)命令字符串中的条目:null chmod 0644 E:\ apache-nutch-1.4 \ runtime \ local \ crawl \ crawldb.locked 在org.apache.hadoop.util.Shell $ ShellCommandExecutor.execute(Shell.java:773)
我检查了日志,发现了这个:
2018-01-18 10:55:26,785 ERROR util.Shell - 无法在hadoop二进制路径中找到winutils二进制文件 java.io.IOException:找不到Hadoop二进制文件中的可执行文件null \ bin \ winutils.exe。
我在几个页面上搜索过这个错误但没有任何帮助。
答案 0 :(得分:2)