Oozie Java Action Error java.lang.NoClassDefFoundError:org / apache / poi / xwpf / usermodel / XWPFDocument

时间:2015-07-22 05:53:15

标签: java apache hadoop oozie

我正在尝试为java操作运行oozie工作流程。我的Java代码可以从HDFS读取Word文件并在HDFS上回写CSV文件。 我的workflow.xml包含 -

<?xml version="1.0" encoding="UTF-8"?>
<workflow-app xmlns="uri:oozie:workflow:0.4" name="Word-Processing">
<start to="PathologyReport-Processing"/>
<action name="PathologyReport-Processing">
<java>
  <job-tracker>${jobTracker}</job-tracker>
  <name-node>${nameNode}</name-node>
 <configuration>
  <property>
   <name>mapred.job.queue.name</name>
   <value>${queueName}</value>
  </property>
  <property>
   <name>oozie.libpath</name>
   <value>${JarPath}</value>
  </property>
 </configuration>
 <main-class>${MainClass}</main-class>
 <arg>-libjars</arg>
 <arg>${JarPath}</arg>
 <arg>${in}</arg>
 <arg>${out}</arg>
</java>
<ok to="end"/>
<error to="fail"/>
</action>
<kill name="fail">
<message>Java Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
</kill>
<end name="end"/>
</workflow-app>

我的job.properties包含以下代码

nameNode=hdfs://CTSC00385700501:8020
jobTracker=CTSC00385700501:8032
workflowRoot=PathologyReport
queueName=default
MainClass=SampleUnstructured
JarPath=hdfs://localhost:8020/user/oozie/${workflowRoot}/lib/poi-3.9.jar
in=hdfs://localhost:8020/user/oozie/${workflowRoot}/SampleWord.docx
out=hdfs://localhost:8020/user/oozie/${workflowRoot}/output
oozie.use.system.libpath=true
oozie.libpath=hdfs://localhost:8020/user/oozie/share/lib/lib_20150513153121/
oozie.wf.application.path=hdfs://localhost:8020/user/oozie/${workflowRoot}

我已经指定了Apache POI jar文件的路径,但仍无法找到它。请帮我解决这个问题。 提前谢谢。

2 个答案:

答案 0 :(得分:0)

你能检查一下你提到的job.property配置吗? 我知道“${workflowRoot}”参数应该是workflow.xml中的mentnion,而job.xml应该被定义为

<property> 
<name>workflowRoot</name>
<value>${workflowRoot}</value> 
</property>

然后尝试运行oozie工作,相信这些将工作smoth。

答案 1 :(得分:0)

来自Oozie MapReduce cookbook

  

...请注意Hadoop支持的-libjars选项   Oozie不支持命令行......

使用Oozie,您应该在Action中添加&lt; file&gt; 元素,以引用要自动下载的JAR,在工作中自动执行-dir-of-the -YARN-容器在运行时。