Sqoop管道分隔符

时间:2017-11-05 13:49:34

标签: delimiter sqoop

我是sqoop的新手。

我正在运行以下sqoop命令从oracle表导入数据

sqoop import --connect jdbc:oracle:thin:<username>/<password>@<IP>:1521:MSDP2 --query "select * from table_name where \$CONDITIONS AND  created=TRUNC(TO_DATE('20171101','YYYYMMDD'))"   --target-dir /stage/ESM/esm_tmp  --hive-table ESM_tab --hive-import -m 1

这是使用COMMA分隔符创建一个配置单元表。由于一列包含客户的地址作为其值,因此该字段中包含逗号。这导致表格中的数据不稳定。

谷歌搜索时我发现我们可以使用&#34; - 字段 - 终止 - &#34; sqoop命令中的选项指定我们想要的分隔符。但我不知道在sqoop命令中将它放在哪里。有人可以帮助我将命令放在上面的sqoop命令中的正确位置。我更喜欢| (管道)分隔符。

2 个答案:

答案 0 :(得分:2)

您可以在--fields-terminated-by '|'之后的命令中的任何位置添加sqoop import

答案 1 :(得分:-1)

导入sqoop后,您可以在任何地方使用。查询后可以使用的最佳情况

-以“ |”结尾的字段

它将起作用。请尝试