我有一个shell脚本
sqoop import \
-Dmapreduce.job.queuename=adhoc \
--connect jdbc:oracle:thin:secret@//secret \
--query "a select" \
--target-dir /apps/hive/warehouse/data.db/fair_usage \
--delete-target-dir \
-m 1 \
--fields-terminated-by '\t'
当我把它放在sh文件中并运行它时,它会起作用。但是,当我试图作为一个oozie动作运行时,它很脆弱。我尝试使用bash动作和sqoop动作。这是Sqoop行动。我还尝试使用<command>import....</command>
标记运行sqoop。
<action name="export_table" cred="hv_cred">
<sqoop xmlns="uri:oozie:sqoop-action:0.2">
<job-tracker>${JOB_TRACKER}</job-tracker>
<name-node>${NAME_NODE}</name-node>
<configuration>
<property>
<name>mapred.task.timeout</name>
<value>600000</value>
</property>
</configuration>
<arg>import</arg>
<arg>-Dmapreduce.job.queuename=adhoc</arg>
<arg>--connect</arg>
<arg>jdbc:oracle:thin:secret@//secret</arg>
<arg>--query</arg>
<arg>"a select"</arg>
<arg>--target-dir</arg>
<arg>/apps/hive/warehouse/data.db/fair_usage</arg>
<arg>--delete-target-dir</arg>
<arg>-m</arg>
<arg>1</arg>
<arg>--fields-terminated-by</arg>
<arg>'\t'</arg>
</sqoop>
<ok to="END"/>
<error to="KILL"/>
</action>
我得到的错误是bash为Main class [org.apache.oozie.action.hadoop.ShellMain], exit code [1]
,sqoop为[org.apache.oozie.action.hadoop.SqoopMain], exit code [1]
。
我没有告诉我任何事情。当我查看日志时,我找不到任何有用的东西。 Stderr只有30行,没有错误。系统日志较长,但也没有错误。
经过一段时间后,新的可读内容
Container killed on request. Exit code is 143
Container exited with a non-zero exit code 143
修改
我尝试再次通过shell操作运行脚本。它工作正常。 sh没有改变所以我可能在wirkflow文件中犯了一个错误。我没有保存它的旧版本,所以不能说那个错误是什么。
外壳行动
<action name='export_table'>
<shell xmlns="uri:oozie:shell-action:0.1">
<job-tracker>${JOB_TRACKER}</job-tracker>
<name-node>${NAME_NODE}</name-node>
<configuration>
<property>
<name>mapred.job.queue.name</name>
<value>${QUEUE_NAME}</value>
</property>
</configuration>
<exec>bash/export_table.sh</exec>
<file>bash/export_table.sh#export_table.sh</file>
</shell>
<ok to="END"/>
<error to="KILL"/>
</action>
仍然不知道为什么sqoop动作不起作用= /
EDIT2
几个月过去了,我接受了我的话。 Fecking sqoop。同样的错误。答案 0 :(得分:0)
bash中的语法语法不作为参数文字传递
<arg>a select</arg>
...
<arg>\t</arg>
编辑:打开文档后https://oozie.apache.org/docs/4.0.0/DG_SqoopActionExtension.html
第一个参数可能是命令而不是第一个<arg>
<command>import</command>
答案 1 :(得分:0)
问题与工作流程或sqoop脚本本身无关,而是与我不了解的一些内部机制有关。缺少libs可能吗?
当我在终端中运行脚本时,会生成一个java类。这个类似乎描述了如何将hive表解析为oracle表或smth。当我开始oozie时,我需要将这个自动生成的文件添加到根目录(具有协调器和工作流的目录)。如果我不oozie失败。该死的东西甚至不会给出任何错误(
无论如何,在将java类添加到root之后,我可以从shell动作运行sqoop。 Sqoop行动仍然无效。我注意到的另一件事是,如果在sqoop中我将使用
执行shell动作--export-dir /apps/hive/warehouse/db.db/table/
但如果我尝试
--hcatalog-database db \
--hcatalog-table table \
在shell中,无论如何都会失败。它可能会尝试将一些库添加到类路径中,但不能或者不能使用。