Sqoop通过bash工作,但不能通过oozie工作

时间:2017-06-09 08:27:21

标签: bash sqoop oozie

我有一个shell脚本

  sqoop import \
  -Dmapreduce.job.queuename=adhoc \
  --connect jdbc:oracle:thin:secret@//secret \
  --query "a select"  \
  --target-dir /apps/hive/warehouse/data.db/fair_usage \
  --delete-target-dir \
  -m 1 \
  --fields-terminated-by '\t' 

当我把它放在sh文件中并运行它时,它会起作用。但是,当我试图作为一个oozie动作运行时,它很脆弱。我尝试使用bash动作和sqoop动作。这是Sqoop行动。我还尝试使用<command>import....</command>标记运行sqoop。

  <action name="export_table" cred="hv_cred">
    <sqoop xmlns="uri:oozie:sqoop-action:0.2">
      <job-tracker>${JOB_TRACKER}</job-tracker>
      <name-node>${NAME_NODE}</name-node>
      <configuration>
        <property>
          <name>mapred.task.timeout</name>
          <value>600000</value>
        </property>
      </configuration>
        <arg>import</arg>
        <arg>-Dmapreduce.job.queuename=adhoc</arg>
        <arg>--connect</arg>
        <arg>jdbc:oracle:thin:secret@//secret</arg>
        <arg>--query</arg>
        <arg>"a select"</arg>
        <arg>--target-dir</arg>
        <arg>/apps/hive/warehouse/data.db/fair_usage</arg>
        <arg>--delete-target-dir</arg>
        <arg>-m</arg>
        <arg>1</arg>
        <arg>--fields-terminated-by</arg>
        <arg>'\t'</arg>
    </sqoop>
    <ok to="END"/>
    <error to="KILL"/>
  </action>

我得到的错误是bash为Main class [org.apache.oozie.action.hadoop.ShellMain], exit code [1],sqoop为[org.apache.oozie.action.hadoop.SqoopMain], exit code [1]

我没有告诉我任何事情。当我查看日志时,我找不到任何有用的东西。 Stderr只有30行,没有错误。系统日志较长,但也没有错误。

经过一段时间后,新的可读内容

Container killed on request. Exit code is 143
Container exited with a non-zero exit code 143

修改

我尝试再次通过shell操作运行脚本。它工作正常。 sh没有改变所以我可能在wirkflow文件中犯了一个错误。我没有保存它的旧版本,所以不能说那个错误是什么。

外壳行动

  <action name='export_table'>
    <shell xmlns="uri:oozie:shell-action:0.1">
      <job-tracker>${JOB_TRACKER}</job-tracker>
      <name-node>${NAME_NODE}</name-node>
      <configuration>
        <property>
          <name>mapred.job.queue.name</name>
          <value>${QUEUE_NAME}</value>
        </property>
      </configuration>
      <exec>bash/export_table.sh</exec>
      <file>bash/export_table.sh#export_table.sh</file>
    </shell>
    <ok to="END"/>
    <error to="KILL"/>
  </action>

仍然不知道为什么sqoop动作不起作用= /

EDIT2

几个月过去了,我接受了我的话。 Fecking sqoop。同样的错误。

2 个答案:

答案 0 :(得分:0)

bash中的语法语法不作为参数文字传递

<arg>a select</arg>
...
<arg>\t</arg>

编辑:打开文档后https://oozie.apache.org/docs/4.0.0/DG_SqoopActionExtension.html

第一个参数可能是命令而不是第一个<arg>

 <command>import</command>

答案 1 :(得分:0)

问题与工作流程或sqoop脚本本身无关,而是与我不了解的一些内部机制有关。缺少libs可能吗?

当我在终端中运行脚本时,会生成一个java类。这个类似乎描述了如何将hive表解析为oracle表或smth。当我开始oozie时,我需要将这个自动生成的文件添加到根目录(具有协调器和工作流的目录)。如果我不oozie失败。该死的东西甚至不会给出任何错误(

无论如何,在将java类添加到root之后,我可以从shell动作运行sqoop。 Sqoop行动仍然无效。我注意到的另一件事是,如果在sqoop中我将使用

执行shell动作
--export-dir /apps/hive/warehouse/db.db/table/

但如果我尝试

--hcatalog-database db \
--hcatalog-table table \

在shell中,无论如何都会失败。它可能会尝试将一些库添加到类路径中,但不能或者不能使用。