我可以在命令行中运行hadoop jar apache-nutch-1.7.job org.apache.nutch.crawl.Crawl args就好了,但是当在oozie中运行时,我得到一个异常
org.apache.hadoop.yarn.exceptions.YarnRuntimeException:java.io.FileNotFoundException:文件不存在:hdfs:// server:8020 / user / hdfs / .staging / job_1416525929767_0494 / job.splitmetainfo 在org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl $ InitTransition.createSplits(JobImpl.java:1566) at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl $ InitTransition.transition(JobImpl.java:1430) 在org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl $ InitTransition.transition(JobImpl.java:1388)
旧Jira报告此异常
https://issues.apache.org/jira/browse/MAPREDUCE-5471
但它被假定修复回2.1.1-beta版本。我在纱线2.5.0。
还有其他人看到这个吗?